-
公开(公告)号:CN116824540A
公开(公告)日:2023-09-29
申请号:CN202310556764.8
申请日:2023-05-17
Applicant: 杭州电子科技大学
Abstract: 本发明公布了一种基于多尺度融合的驾驶员注意力预测方法。该方法首先利用VGG16获取视频帧的多尺度特征,并构建了多尺度融合模块,通过上、下两个方向的特征传递,充分利用高低层特征间的互补性,融合多尺度信息。然后使用Conv‑LSTM,进一步融合连续视频帧之间的时空信息,捕捉其时间动态关系用以生成潜在注意力图,并在对其进行解码后获得最终的驾驶员注意力预测结果。相较于现有方法,本发明对多尺度信息进行了充分利用,能够获取RGB图像中的复杂信息,避免噪声干扰,生成的注意力预测结果拥有更高的准确性、鲁棒性。