-
公开(公告)号:CN114387553B
公开(公告)日:2024-03-22
申请号:CN202210052157.3
申请日:2022-01-18
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于帧结构感知聚合的视频人脸识别方法,包括:采用人脸检测模型检测视频数据中每一帧中所含的面部区域并裁剪为固定尺寸的图像,作为输入视频帧;采用跨尺度特征提取网络提取输入的每一个视频帧的特征表示;采用帧结构感知聚合模块为每个特征表示赋予权重;将每个特征图降维、并根据权重进行聚合,得到视频人脸特征向量;集训练模型、并微调网络参数;采用人脸识别网络框架完成最后的识别任务。这种特征提取网络能适应面部特征比例变化的同时,保持对不同尺度特征的高效学习,同时结合帧间关系的挖掘对上下文信息进行有效建模,能够利用各个视频帧的特征及其空间结构信息,最终获得更具鲁棒性的视频人脸特征表示用于识别。
-
公开(公告)号:CN114898439B
公开(公告)日:2024-03-19
申请号:CN202210614368.1
申请日:2022-06-01
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V20/40 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种基于分段策略和多头卷积注意力的视频人脸识别方法,包括如下步骤:1)对视频人脸数据集进行预处理;2)对步骤1)中得到的视频帧图像集进行分段线性映射、位置嵌入操作;3)深度特征提取;4)识别;5)损失函数进行训练;6)完成人脸识别。本技术方案分段策略有效去除了跨度较大的视频帧面部姿态、大小等变化较大而对特征提取施加的冗余噪声,并结合提出的多头卷积注意力模块有效提取冗长视频序列的上下文信息,同时大幅降低了模型的复杂程度,分段损失函数的设计加速了网络的训练并提高模型抗干扰的能力,最终使得模型具有更好的识别性能。
-
公开(公告)号:CN114898439A
公开(公告)日:2022-08-12
申请号:CN202210614368.1
申请日:2022-06-01
Applicant: 桂林电子科技大学
IPC: G06V40/16 , G06V20/40 , G06V10/82 , G06V10/774 , G06N3/04
Abstract: 本发明公开了一种基于分段策略和多头卷积注意力的视频人脸识别方法,包括如下步骤:1)对视频人脸数据集进行预处理;2)对步骤1)中得到的视频帧图像集进行分段线性映射、位置嵌入操作;3)深度特征提取;4)识别;5)损失函数进行训练;6)完成人脸识别。本技术方案分段策略有效去除了跨度较大的视频帧面部姿态、大小等变化较大而对特征提取施加的冗余噪声,并结合提出的多头卷积注意力模块有效提取冗长视频序列的上下文信息,同时大幅降低了模型的复杂程度,分段损失函数的设计加速了网络的训练并提高模型抗干扰的能力,最终使得模型具有更好的识别性能。
-
公开(公告)号:CN114387553A
公开(公告)日:2022-04-22
申请号:CN202210052157.3
申请日:2022-01-18
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于帧结构感知聚合的视频人脸识别方法,包括:采用人脸检测模型检测视频数据中每一帧中所含的面部区域并裁剪为固定尺寸的图像,作为输入视频帧;采用跨尺度特征提取网络提取输入的每一个视频帧的特征表示;采用帧结构感知聚合模块为每个特征表示赋予权重;将每个特征图降维、并根据权重进行聚合,得到视频人脸特征向量;集训练模型、并微调网络参数;采用人脸识别网络框架完成最后的识别任务。这种特征提取网络能适应面部特征比例变化的同时,保持对不同尺度特征的高效学习,同时结合帧间关系的挖掘对上下文信息进行有效建模,能够利用各个视频帧的特征及其空间结构信息,最终获得更具鲁棒性的视频人脸特征表示用于识别。
-
-
-