-
公开(公告)号:CN117953053A
公开(公告)日:2024-04-30
申请号:CN202311735305.2
申请日:2023-12-15
Applicant: 东北大学
IPC: G06T7/73 , G06F16/53 , G06V10/26 , G06V20/70 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明属于视觉识别定位技术领域,公开了一种基于图像检索双域语义域适应的长期视觉定位方法。建立双域体系结构网络模型,构成自适应三重特征损失函数、循环一致损失函数、语义交叉熵损失函数、三重语义交叉熵损失函数、域特征一致损失函数、SAM损失函数六种函数更新双域体系结构网络模型;更新后得到最终双域体系结构网络模型,进行视觉定位。该发明所提出的框架只需要在虚拟数据集Virtual KITTI 2上进行训练而不需要引入其他真实数据集进行训练,就可以使模型具有很好的域适应能力并可以在其他数据集上取得良好的效果,从而提高最终的图像检索性能。
-
公开(公告)号:CN119850894A
公开(公告)日:2025-04-18
申请号:CN202411908371.X
申请日:2024-12-24
Applicant: 东北大学
Abstract: 本发明计算机视觉技术领域,公开一种基于关联指导网络的长期视觉定位方法。模型训练阶段包括感知网络训练和概念网络训练;概念网络训练完成后,概念网络作为预训练模型对感知网络进行训练,概念网络同时进行优化;关联指导机制进行信息交互;图像检索阶段,采用训练完成后的感知网络进行图像检索。该发明通过领域自适应学习及关联指导机制将概念网络中的特征用于指导感知网络中的特征学习,使模型最后训练得到的特征在环境变化下具有鲁棒性。此外,本发明使用了一种不需要额外数据构成的概念数据库用于对概念网络进行自启发的学习,以更好的对感知网络进行域特征指导,从而提高最终的图像检索性能。
-
公开(公告)号:CN118411690A
公开(公告)日:2024-07-30
申请号:CN202410489874.1
申请日:2024-04-23
Applicant: 东北大学 , 江苏曙光光电有限公司
IPC: G06V20/56 , G06V10/44 , G06V10/52 , G06V10/82 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06V10/74 , G06T7/50 , G06T7/73
Abstract: 本发明提供一种融合语义深度与连续信息的长期视觉定位方法,涉及计算机视觉技术领域,本发明通过对虚拟数据集和真实数据集提取多尺度特征,依次生成语义,深度,语义图,确保提取的多尺度特征包含语义和深度信息,并且利用三元组损失来克服外观变化的影响;利用融合判别器来判别语义‑深度互信息来进一步增加语义和深度信息的准确性;同时利用特征判别器将虚拟数据集上学习的特征提取能力迁移到真实数据集中,增加特征编码器的适应性;利用数据集的连续性进一步提升视觉定位的精度,并使用L1距离计算优化特征间的相似度,本发明利用提取的多尺度特征计算图像之间的相似度,完成长期视觉定位任务。
-
-