基于自注意增强CNN的视频序列表情识别系统及方法

    公开(公告)号:CN111523462B

    公开(公告)日:2024-02-09

    申请号:CN202010324540.0

    申请日:2020-04-22

    Abstract: 本发明公开了一种基于自注意增强CNN的视频序列表情识别系统及方法,系统包括特征增强CNN模块、自注意力机制模块和全连接层;视频序列输入特征增强CNN模块,特征增强CNN模块输出的特征向量输入自注意力机制模块,自注意力机制模块输出的特征向量输入全连接层,全连接层将特征向量映射到样本标记空间中实现分类;特征增强CNN模块在骨干网络中增加若干卷积层,在骨干网络的中间层引出特征增强支路,并将特征增强支路的输出与骨干网络的输出融合,将网络中的全连接层替换为全局平局池化层。本发明提出的系统的复杂度更低,可有效提高视频序列表情识别的准确率,在人机交互、智慧教育、病人监护等领域具有广大应用前景。

    基于加权块张量稀疏图映射的非约束人脸识别方法

    公开(公告)号:CN111783615B

    公开(公告)日:2023-08-22

    申请号:CN202010599046.5

    申请日:2020-06-28

    Abstract: 基于加权块张量稀疏图映射的非约束人脸识别方法,涉及人脸识别方法的技术领域。先将原始样本图像分成B个块,每个图像块用二阶张量表示,引入类别标签,构建监督超完备的块张量字典;再在正则约束求解块样本的同类稀疏重构系数的基础上,增加类内紧凑度约束和权值约束,以距离权值进一步表征同类块样本间的类内差异,在块样本张量空间自适应构建更准确的稀疏近邻图;最后对块样本进行双边低维投影,引入全局约束因子,得到双边低维投影矩阵。本发明充分考虑非约束人脸图像数据的复杂性,用稀疏表示技术自适应获取高维张量数据的近邻分布图,有效提取出高度扭曲的非约束人脸数据的低维流形本质结构,大大提高了非约束人脸识别的准确性。

    基于匹配-回归网络的目标跟踪方法及训练方法

    公开(公告)号:CN111523463B

    公开(公告)日:2023-05-23

    申请号:CN202010324781.5

    申请日:2020-04-22

    Abstract: 本发明公开了一种基于匹配‑回归网络的目标跟踪方法及训练方法,应用于图像处理技术领域,输入包括若干帧的目标待跟踪序列,对每一帧图像在目标搜索区域内进行目标跟踪;根据中心匹配网络输出目标中心位置,根据已确定的目标中心位置获取中心匹配网络最后一个卷积层输出的特征图,将所述特征图作为边界回归网络的输入;边界回归网络根据输入特征图,根据所述目标中心进行中心点发散,确定目标中心的边界位置,输出锚框的高度和宽度。本发明利用孪生网络确定目标中心位置,在边界回归网络中利用两层LSTM网络结合历史帧的时序特征信息,输出更精确的宽高比可变的锚框,提高视频序列中目标跟踪的准确性和鲁棒性。

    一种基于深度学习的线缆接口松脱检测方法

    公开(公告)号:CN114155435A

    公开(公告)日:2022-03-08

    申请号:CN202111458772.6

    申请日:2021-12-01

    Abstract: 本发明提供了一种基于深度学习的线缆接口松脱检测方法,检测前,在接口两端的线缆接头上做上标识线;检测时,拍摄获取带有标识线一侧的线缆接口图像,利用神经网络模型,检测识别出图像中的线缆接口并输出相应线缆接口图像选框区域,之后提取线缆接口图像区域中的标识线,并根据提取出的标识线状态,判断线缆接口是否松脱。上述检测方法不仅能够替代人工巡检,并且相比架设传感器等传统方法,更加稳定可靠,以及能够在例如jetson nano等边缘计算平台上部署,因此整体所需的硬件成本较为低廉。

    基于核扩展字典稀疏表示的遮挡人脸识别方法

    公开(公告)号:CN112966649A

    公开(公告)日:2021-06-15

    申请号:CN202110319464.9

    申请日:2021-03-25

    Abstract: 本发明公开了一种基于核扩展字典稀疏表示的遮挡人脸识别方法,包括步骤(S1)):构建训练样本集X;步骤(S2):构建标准样本集N;步骤(S3):构建测试样本集Y;步骤(S4):构建训练样本集X的遮挡字典D1和测试样本集Y的遮挡字典D2,得到混合完备遮挡字典D;步骤(S5):根据混合完备遮挡字典D,采用SRC模型对待测样本进行线性稀疏表示分类,进行该待测样本的遮挡人脸识别。本发明用来消除样本字典中像素冗余信息,获取更具判别性和表征性的字典,使样本字典中仅包含人脸结构特征,而不含有像素冗余信息和干扰信息,并使遮挡字典中仅包含训练样本和测试样本的遮挡信息,而无人脸结构特征,两者相结合,以提高遮挡人脸识别的准确性。

    基于卷积神经网络和子带SRP-PHAT空间谱的声源定位方法

    公开(公告)号:CN112904279A

    公开(公告)日:2021-06-04

    申请号:CN202110059164.1

    申请日:2021-01-18

    Abstract: 本发明公开了一种基于卷积神经网络和子带SRP‑PHAT空间谱的声源定位方法,包括:麦克风阵列采集语音信号,对采集的语音信号进行分帧和加窗的预处理得到单帧信号;计算每帧信号的子带SRP‑PHAT空间谱矩阵;将所有帧信号的子带SRP‑PHAT空间谱矩阵输入训练完成的卷积神经网络,输出语音信号属于每个方位角的概率,取概率最大的方位角作为该语音信号的声源方位角估计值。本发明可提高麦克风阵列在复杂声学环境下的声源定位性能,提高对声源空间结构、混响和噪声的泛化能力;可离线完成卷积神经网络的训练过程,将训练好的卷积神经网络保存于内存中,测试时仅需要一帧信号就可以实现实时声源定位。

    基于自注意增强CNN的视频序列表情识别系统及方法

    公开(公告)号:CN111523462A

    公开(公告)日:2020-08-11

    申请号:CN202010324540.0

    申请日:2020-04-22

    Abstract: 本发明公开了一种基于自注意增强CNN的视频序列表情识别系统及方法,系统包括特征增强CNN模块、自注意力机制模块和全连接层;视频序列输入特征增强CNN模块,特征增强CNN模块输出的特征向量输入自注意力机制模块,自注意力机制模块输出的特征向量输入全连接层,全连接层将特征向量映射到样本标记空间中实现分类;特征增强CNN模块在骨干网络中增加若干卷积层,在骨干网络的中间层引出特征增强支路,并将特征增强支路的输出与骨干网络的输出融合,将网络中的全连接层替换为全局平局池化层。本发明提出的系统的复杂度更低,可有效提高视频序列表情识别的准确率,在人机交互、智慧教育、病人监护等领域具有广大应用前景。

    面向目标检测的图像无参考清晰度质量检测方法

    公开(公告)号:CN111429437A

    公开(公告)日:2020-07-17

    申请号:CN202010234324.7

    申请日:2020-03-30

    Abstract: 本发明公开了一种面向目标检测的图像无参考清晰度质量检测方法,包括如下步骤:在采集的图像数据集中,任选一幅图像进行灰度化处理;均值滤波;用scharr算子求得图像在水平方向和垂直方向上的梯度图;在水平方向和垂直方向上进行梯度叠加,并求得各自若干峰值点;由峰值点分别做垂直垂线和水平垂线,以若干交点为中心得到若干典型区域,计算得到该图像典型区域的梯度均值和标准差;统计得到整体图像数据集典型区域的梯度均值和标准差并设置阈值,根据数据集中某幅图像典型区域的梯度均值是否小于该阈值,来判断该图像的清晰度。本发明能检测出图片集中模糊的图像,对于深度学习制作数据集,训练出鲁棒性强、准确度高的网络具有重要意义。

    一种基于光照估计的光照人脸识别方法

    公开(公告)号:CN107239729A

    公开(公告)日:2017-10-10

    申请号:CN201710228908.1

    申请日:2017-04-10

    Abstract: 本发明公开了一种基于光照估计的光照人脸识别方法,其方法为:首先依据图像成像模型从原始人脸图像中估计出初始光照,然后根据初始光照计算出光线遮挡校正光照与光照融合因子,构建光照融合模型,实现光线遮挡光照校正,接着运用全变分模型对光线遮挡校正后光照进行平滑滤波获取原始人脸图像的最终光照,最后运用光照不变量提取模型获取原始图像的光照不变量。本发明能较好地处理阴影边缘问题,提取包含丰富面部细节特征、更接近于原始人脸本征的光照不变量,不仅能满足图像的成像原理,光照的缓慢变化特性,还能适应复杂的照明环境。

    室内定位系统中无线传输环境损耗参数的优化方法

    公开(公告)号:CN103916956A

    公开(公告)日:2014-07-09

    申请号:CN201410172858.6

    申请日:2014-04-25

    Abstract: 本发明提供一种室内定位系统中无线传输环境损耗参数的优化方法,利用现有节点之间的相互通信,已知RSSI和d的值,反推出实际无线环境中A,n的参数值,再利用参数带入公式计算,对未知节点进行定位。根据参考节点之间的相互通信,由RSSI,d值反推出A,n的值,再求平均。这样不仅可以自动调节反映未知节点所处位置的环境情况,也不需要像传统的取值方法,需要事先进行大量的测试,从而减小工作量,达到环境自适应的目的。采用高斯模型来选择高概率时间发生的区域可以有效避免小概率偶然事件对数值产生的干扰,从而增加模型的精确性。

Patent Agency Ranking