基于自注意力的视觉惯性里程计三维场景定位方法和装置

    公开(公告)号:CN118376237A

    公开(公告)日:2024-07-23

    申请号:CN202410511979.2

    申请日:2024-04-26

    Abstract: 本发明提供一种基于自注意力的视觉惯性里程计三维场景定位方法和装置,包括:提取IMU数据的综合时序特征;利用卷积神经网络提取视觉数据的视觉特征;根据姿态归回模块中第一LSTM网络在上一时刻保存的历史隐藏状态信息将当前时刻IMU数据的综合时序特征和视觉数据的视觉特征通过视觉模态选择的方式进行特征融合得到第一融合时序特征;利用基于自注意力的融合模块对第一融合时序特征进行处理得到第二融合时序特征;将第二融合时序特征输入姿态归回模块进行姿态回归得到当前时刻移动设备的位姿,其中,所述姿态归回模块包括第一LSTM网络和全连接层;本发明通过学习IMU内部数据间的关系,有效提高了移动设备的三维定位精度。

Patent Agency Ranking