-
公开(公告)号:CN117455988A
公开(公告)日:2024-01-26
申请号:CN202311362725.0
申请日:2023-10-19
Applicant: 东北大学
IPC: G06T7/73 , G06N3/0464 , G06N3/082
Abstract: 本发明提供一种基于注意力机制的多尺度视觉地点识别方法,涉及机器人导航与定位技术领域。该方法包括:构建训练集并进行采样;构建融合VGG16_NetVLAD模型和注意力机制的ScaleAttNet网络模型,利用三元组损失函数和采样后的图像数据训练ScaleAttNet网络模型;获取图像数据库和待定位图像并采样,将采样得到的待定位图像的图像金字塔和图像数据库中所有图像的图像金字塔分别输入训练好的ScaleAttNet网络模型,得到待定位图像的多尺度特征和图像数据库中所有图像的多尺度特征,计算图像数据库中的所有图像与待定位图像的距离并排序,根据排序结果确定图像数据库中与待定位图像的距离最小的图像的位置信息作为待定位图像的位置信息,完成待定位图像的地点识别,提高地点识别算法的准确率。