一种基于手部关键点和transformer的动态手势识别方法和系统

    公开(公告)号:CN114898457B

    公开(公告)日:2024-06-28

    申请号:CN202210374769.4

    申请日:2022-04-11

    Abstract: 本发明提供了一种基于手部关键点和transformer的动态手势识别方法,先获取T时间段内的手部图像序列,并获取各手部图像中的手部关键点;将T时间段内手部图像序列各手部图像中的手部关键点坐标拼接为三维矩阵,拼接后的关键点输入矩阵维度为3*T*K;将拼接得到的三维矩阵输入预训练好的神经网络模型,依次进行近距关节局部运动特征提取、特征转置、远距关节全局运动特征提取、transformer注意力分配、softmax函数激活;经神经网络模型预测后,输出T时间段上的动态手势的识别结果;本发明提供的方法,使用transformer模块,使网络在预测手势时能够聚焦特征性更强的关键点运动信息,使模型的预测结果更加准确,且拥有较少的网络参数和更快的运行速度,从而达到实时动态手势识别的效果。

    一种基于毫米波图像的物品检测方法、装置及可读介质

    公开(公告)号:CN114612764B

    公开(公告)日:2025-02-25

    申请号:CN202210142734.8

    申请日:2022-02-16

    Abstract: 本发明公开了一种基于毫米波图像的物品检测方法、装置及可读介质,通过获取人体正面和背面的毫米波图像,将人体正面和背面的毫米波图像输入经训练的主干网络分别提取正面特征和背面特征;基于注意力机制将正面特征和背面特征分别进行交互融合扩充,并将得到的扩充正面特征图像和/或扩充背面特征图像输入经训练的基于非同源数据的多任务神经网络架构,输出全图物品检测结果和人体骨架检测结果;基于人体骨架检测结果将图像划分成多个特征块,并对每个特征块采用独立的检测头分别进行检测,得到二次检测结果,再在原图上进行位置映射,得到分块物品检测结果;将分块物品检测结果与全图物品检测结果进行非极大值抑制,得到最终的物品检测结果。

    闸机通道防欺骗的处理方法、装置、介质及设备

    公开(公告)号:CN116704602A

    公开(公告)日:2023-09-05

    申请号:CN202310643647.5

    申请日:2023-06-01

    Abstract: 本申请的实施例提供了一种闸机通道防欺骗的处理方法、装置、介质及设备。该方法包括:获取针对目标区域进行拍摄得到的图像序列,并确定图像序列中各待识别图像中包含的行人的头部特征信息及对应的头部检测框;根据各行人的头部特征信息以及头部检测框进行预测,确定行人的人体检测框,并提取对应的人体外观特征;根据待识别图像的时间戳信息以及待识别图像中包含的各行人的头部检测框、人体检测框以及人体外观特征进行目标跟踪,生成与各行人对应的运动轨迹,在闸机完成一次开关状态后,若进行刷脸请求过闸的行人未完成过闸,且存在其他行人完成过闸,则触发冒名过闸报警。本申请实施例的技术方案保证冒名过闸行为识别的准确性,并提高识别效率。

    一种基于手部关键点和transformer的动态手势识别方法和系统

    公开(公告)号:CN114898457A

    公开(公告)日:2022-08-12

    申请号:CN202210374769.4

    申请日:2022-04-11

    Abstract: 本发明提供了一种基于手部关键点和transformer的动态手势识别方法,先获取T时间段内的手部图像序列,并获取各手部图像中的手部关键点;将T时间段内手部图像序列各手部图像中的手部关键点坐标拼接为三维矩阵,拼接后的关键点输入矩阵维度为3*T*K;将拼接得到的三维矩阵输入预训练好的神经网络模型,依次进行近距关节局部运动特征提取、特征转置、远距关节全局运动特征提取、transformer注意力分配、softmax函数激活;经神经网络模型预测后,输出T时间段上的动态手势的识别结果;本发明提供的方法,使用transformer模块,使网络在预测手势时能够聚焦特征性更强的关键点运动信息,使模型的预测结果更加准确,且拥有较少的网络参数和更快的运行速度,从而达到实时动态手势识别的效果。

    一种车辆盲区的检测系统

    公开(公告)号:CN114782923B

    公开(公告)日:2024-05-03

    申请号:CN202210490050.7

    申请日:2022-05-07

    Abstract: 本发明提供一种车辆盲区的检测系统,实现过程包括下述步骤:S1、收集盲区数据集,并进行样本标注;S2、基于Yolov5网络,进行盲区检测和分割联合网络结构的构建,并改进检测分支训练时的样本分配策略;所述盲区检测和分割联合网络结构包括两个检测分支和一个分割分支;S3、根据所述样本分配策略确定训练过程中正负样本,进行检测和回归联合训练,得到训练好的车辆盲区的检测模型。本发明基于Yolov5框架,定制了一个检测和分割联合的多任务网络结构,在训练阶段可以同时提高检测和分割算法的精度;改进样本分配策略,提升检测精度;即可在后处理阶段,利用分割分支结果使检测的目标外接框更加稳定,从而得到障碍物的精准落脚点。

    基于人脸图像进行年龄和性别预测的方法、系统和设备

    公开(公告)号:CN111091109B

    公开(公告)日:2023-04-07

    申请号:CN201911345806.3

    申请日:2019-12-24

    Inventor: 徐绍凯 贾宝芝

    Abstract: 本发明提供一种基于人脸图像进行年龄和性别预测的方法、系统和设备,方法包括:获取一图片;使用人脸检测算法检测图片中的人脸位置和特征点位置,根据预设的参数对人脸进行矫正和截取,得到标准的人脸图片;使用预训练的神经网络模型对标准的人脸图片进行预测,输出人脸年龄和性别;神经网络模型采用了特征金字塔结构,能够提取从高到低的更丰富的多层次人脸特征,同时将年龄值表示为端点权值向量,在模型训练阶段作为中间层监督信息与年龄值回归一起训练模型,而在预测阶段直接输出年龄回归值,在速度和精度上均优于现有方法;本发明使用单阶段单模型的方法,快速准确地对视频或图片中的人脸进行年龄和性别的预测,预测结果可用于多种场景。

Patent Agency Ranking