-
公开(公告)号:CN118379512A
公开(公告)日:2024-07-23
申请号:CN202410602366.X
申请日:2024-05-15
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种级联型全局描述符聚合的视觉场景识别方法,摒弃以往主流的局部特征聚合技术,提出一种新的整体特征聚合方案,利用具有SCA模块和GIA模块的GICNet模型完成,包括下述步骤:1)利用嵌入SCA模块的改进CNN主干网络提取查询图像I的中间特征表达FSCA;2)将3‑D张量的中间特征表达FSCA重新塑造为一个2‑D表示,得到展平特征图Fflat,此时的2‑D张量的展平特征图Fflat视为一组大小为d的1‑D特征;3)将展平特征图Fflat输入到GIA模块中进行处理,利用全连接层的能力递归地将通道方向和空间方向上的全局关系合并到2‑D展平的特征图Fflat的每个元素中,最终得到鲁棒性的全局描述子FGIA;将全局描述子FGIA依次进行展平操作和L2‑norm处理,得到查询图像I的最终的1‑D判别向量Fdiscr。
-
公开(公告)号:CN119206595A
公开(公告)日:2024-12-27
申请号:CN202411219130.4
申请日:2024-09-02
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明涉及机器人自主导航与视觉识别技术领域,公开了一种自注意力下空间自感知的视觉场景识别方法,采用主要由ViTbackbone和特征聚合模块Token Module两部分所构成的S3VPR模型实现,包括下述步骤:1)对于给定的输入图像,利用ViTbackbone提取基础特征,得到特征图,而后形成新特征图;2)对新特征图进行reshape操作,将其从二维特征图转换为三维特征图;3)使用特征聚合模块Token Module先沿空间维度对三维特征图进行处理得到空间交互特征图,然后再沿通道维度进行处理得到通道交互特征图,而后进一步处理得到全局描述子;4)利用相似度算法将查询图像的全局描述子和数据库中所有数据库图像的全局描述子进行一一比较,找出所有和查询图像归属同一场景的数据库图像。
-
公开(公告)号:CN119131719A
公开(公告)日:2024-12-13
申请号:CN202411054021.1
申请日:2024-08-02
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V20/00 , G06V10/44 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明涉及机器人自主导航与视觉识别技术领域,公开了一种域不变信息挖掘的视觉场景识别方法,采用主干网络VGG‑DIMM、聚合头NetVLAD两部分组成DIMNet模型实现,包括下述步骤:对于给定的输入图像,利用VGG‑DIMM初步提取其局部特征描述符;以VGG‑DIMM提取得到的局部特征描述符作为输入,使用原始的NetVLAD将局部特征描述符聚合成一维的全局特征描述符F(I);通过相似度算法,将查询图像的全局特征描述符F(I)与所有数据库图像的全局特征描述符F(I)进行一一比较,从而找出所有和查询图像归属同一场景的数据库图像;通过所采用的域不变信息挖掘模块(DIMM)在级联的卷积单元组中,纳入特征图不同空间区域间的相互依赖关系,达到DIMNet模型对域不变的静态类物体的关注度增强的目的。
-
-