-
公开(公告)号:CN119206595A
公开(公告)日:2024-12-27
申请号:CN202411219130.4
申请日:2024-09-02
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明涉及机器人自主导航与视觉识别技术领域,公开了一种自注意力下空间自感知的视觉场景识别方法,采用主要由ViTbackbone和特征聚合模块Token Module两部分所构成的S3VPR模型实现,包括下述步骤:1)对于给定的输入图像,利用ViTbackbone提取基础特征,得到特征图,而后形成新特征图;2)对新特征图进行reshape操作,将其从二维特征图转换为三维特征图;3)使用特征聚合模块Token Module先沿空间维度对三维特征图进行处理得到空间交互特征图,然后再沿通道维度进行处理得到通道交互特征图,而后进一步处理得到全局描述子;4)利用相似度算法将查询图像的全局描述子和数据库中所有数据库图像的全局描述子进行一一比较,找出所有和查询图像归属同一场景的数据库图像。
-
公开(公告)号:CN119131719A
公开(公告)日:2024-12-13
申请号:CN202411054021.1
申请日:2024-08-02
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V20/00 , G06V10/44 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明涉及机器人自主导航与视觉识别技术领域,公开了一种域不变信息挖掘的视觉场景识别方法,采用主干网络VGG‑DIMM、聚合头NetVLAD两部分组成DIMNet模型实现,包括下述步骤:对于给定的输入图像,利用VGG‑DIMM初步提取其局部特征描述符;以VGG‑DIMM提取得到的局部特征描述符作为输入,使用原始的NetVLAD将局部特征描述符聚合成一维的全局特征描述符F(I);通过相似度算法,将查询图像的全局特征描述符F(I)与所有数据库图像的全局特征描述符F(I)进行一一比较,从而找出所有和查询图像归属同一场景的数据库图像;通过所采用的域不变信息挖掘模块(DIMM)在级联的卷积单元组中,纳入特征图不同空间区域间的相互依赖关系,达到DIMNet模型对域不变的静态类物体的关注度增强的目的。
-