-
公开(公告)号:CN115761858A
公开(公告)日:2023-03-07
申请号:CN202211509716.5
申请日:2022-11-29
Applicant: 桂林电子科技大学
Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。
-
公开(公告)号:CN115761858B
公开(公告)日:2025-05-09
申请号:CN202211509716.5
申请日:2022-11-29
Applicant: 桂林电子科技大学
Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。
-
公开(公告)号:CN116503937A
公开(公告)日:2023-07-28
申请号:CN202310487577.9
申请日:2023-05-04
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于人脸外观的深度学习注视预测方法及系统,方法包括:获取待测对象的人脸外观图片;对所述待测对象的人脸外观图片进行处理,提取人脸图片;将所述人脸图片输入训练好的注视预测模型中,预测所述人脸图片中人眼注视方向。本发明通过将卷积神经网络、窗口多头注意力机制和移动窗口多头注意力机制结合,提高了网络的图片局部空间特征学习能力和全局特征建模能力,解决了现有基于视觉变压器的注视预测方法无法多尺度特征学习以及图片全局自注意力计算困难的问题。
-
-