一种基于跨尺度信息交互的跨模态行人重识别方法

    公开(公告)号:CN120071384A

    公开(公告)日:2025-05-30

    申请号:CN202411905192.0

    申请日:2024-12-23

    Abstract: 本发明公开了一种基于跨尺度信息交互的跨模态行人重识别方法,属于计算机视觉技术领域,主要包括:把可见光行人图像和红外行人图像送入跨模态混淆器,运用成熟的图像处理技术,对这两种不同模态的输入图像进行预处理,进而得到符合模型要求的输入对象;随后,采用参数分离的特征提取网络,对输入对象进行处理分别获取可见光图像特征和红外图像特征;在此基础上,利用参数共享的特征提取网络,并结合跨尺度交互模块,进一步提取出模态共享特征;同时,针对特征提取网络所输出的两种不同尺度的特征,分别从中提取全局特征以及局部区域特征信息;最后,依据所获取的特征采用多损失联合优化策略,优化模型,最后基于查询图像和图库图像特征之间的相似度来确定查询结果。本发明能够显著提高可见光红外行人重识别的准确性与效率,在安防监控等诸多需要行人身份识别的领域有着广阔的应用前景。

    一种基于水下线索驱动提示学习的端到端单目标跟踪方法

    公开(公告)号:CN119832025A

    公开(公告)日:2025-04-15

    申请号:CN202411843124.6

    申请日:2024-12-13

    Abstract: 本发明提供一种基于水下线索驱动提示学习的端到端单目标跟踪方法,属于计算机视觉领域。主要包括:利用线索特征生成网络中的通道注意力机制对所述模板图像和搜索图像以通道方式调制;利用线索特征生成网络中的空间维度注意力机制对所述调制特征进行标记之间的局部交互以获取水下物体纹理特征;进行多头交叉注意操作得到水下线索提示特征;将模版和搜索特征以及水下线索提示特征输入到融合模块;利用模版和搜索特征继续与相关性分数做矩阵对应位置相乘操作得到水下前景纹理特征;将水下线索提示特征与模版和搜索特征输入到跟踪器的主干Transformer层中进行信息交互,计算预测框信息。本发明解决了现有单目标跟踪器结构在水下场景中无法端到端训练的问题。

    一种基于几何一致性学习的不完全高光谱图像分类方法

    公开(公告)号:CN119313937A

    公开(公告)日:2025-01-14

    申请号:CN202411283721.8

    申请日:2024-09-13

    Abstract: 本发明公开了一种基于几何一致性学习的不完全高光谱图像分类方法,包括:获取待分类的高光谱图像;对高光谱图像样本进行矩阵分解,得到共识表征;对每个波段的数据进行补全并进行空间几何结构探索;将共识表征与数据的空间几何结构探索结果连接到一个框架中联合优化,从而得到共识表示;将共识表示,输入到一步分类策略模块中,得到最后的分类矩阵;利用迭代更新策略,在固定一个变量的同时,交替更新其他变量,直至收敛;最后根据指示矩阵,得到图像分类结果。本发明通过张量补全技术对不完整的高光谱数据进行补全,使得数据之间的关系更好地被捕捉,并且采用谱旋转进行一步得出分类结果,避免了由两步得出结果地误差累积。

    一种基于物理感知transformer的水下图像增强方法

    公开(公告)号:CN117522755A

    公开(公告)日:2024-02-06

    申请号:CN202311483091.4

    申请日:2023-11-08

    Abstract: 本发明公开了一种基于物理感知transformer的水下图像增强方法,包括以下步骤:获取待处理的水下图像以及与其对应的透射图;将所述待处理的水下图像和对应的透射图输入训练好的基于物理感知机制的transformer网络模型,所述基于物理感知机制的transformer网络模型使用U‑Net作为基本架构,包括编码器、bottleneck和解码器,所述编码器包括3个物理感知的Swin Transformer Blocks,所述解码器包括3个物理感知的Swin Transformer Blocks;获取基于物理感知机制的transformer网络模型的输出作为增强后的水下图像。本发明通过将水下图像的物理成像过程与transformer网络相融合,能够有效缓解真实水下场景中因后向散射导致获取图像存在色偏和低对比度的问题,得到颜色自然、对比度清晰的水下图像,从而提高其视觉感知效果。

    基于水下目标近邻分布的海产品自主抓取引导方法

    公开(公告)号:CN111652118B

    公开(公告)日:2023-06-20

    申请号:CN202010479604.4

    申请日:2020-05-29

    Abstract: 本发明提供一种基于水下目标近邻分布的海产品自主抓取引导方法,包括:水下机器人采用水下相机获取可视区域图像;将所述可视区域图像均分为多个子区域;采用目标物检测算法检测每一个所述子区域内的目标物和障碍物的数量;根据所述目标物和障碍物的数量对所述子区域进行评分,并根据所述评分结果进行排序;抓捕所述可视区域图像评分最高的子区域内的目标物;以当前最高分子区域为起始点进行下一可视区域图像的采集,直至将整个区域的可视区域图像采集完毕。本发明因小目标物在水下图像检测中存在模糊、偏色等可视化问题,采用分块检测策略,解决小目标在检测过程中的细节特征丢失问题。

    一种海洋养殖区水下场景全景图生成方法

    公开(公告)号:CN113538702A

    公开(公告)日:2021-10-22

    申请号:CN202110738641.7

    申请日:2021-06-30

    Abstract: 本发明公开了一种海洋养殖区水下场景全景图生成方法,包括规划水下机器人行走路径,利用水下机器人采集水下图像,对采集的多张所述图像进行海产品目标特征提取获取局部特征图和全局特征图;并通过目标检测算法模型对局部特征图进行目标特征提取,获得鲁棒性强的局部掩码特征图,对目标特征图进行掩码处理获得目标掩码特征图,将目标掩码特征图与全局特征图作矩阵掩码操作,获得图像中具有代表性的特征图以及对图片进行曝光和判断是否为同一图片等处理,进而利用拼接算法对检测到同一物体的图像进行图像拼接,可以获得水下拼接图像。该方法可以通过机器人在当前目标区域内完成水下图像拼接后,使得观测的效果更加清晰、准确和精准。

    一种面向UUV真实作业光照场景的水下图像清晰化方法

    公开(公告)号:CN116246154B

    公开(公告)日:2025-05-16

    申请号:CN202211635817.7

    申请日:2022-12-19

    Abstract: 本发明提供一种面向UUV真实作业光照场景的水下图像清晰化方法,包括以下步骤:构建能够描述UUV作业光照场景的成像模型;合成带有单点光斑的水下图像数据集,并利用其训练清晰化网络模型;提出基于光斑径向梯度分布特性的损失函数,有效分离光晕层和光照分布均匀的低质水下图像;引入基于Retinex理论的网络对低质水下图像进行分解,得到照度图和反射图;最后,分别通过反射图恢复网络和亮度调节网络获得具有丰富色彩和细节的反射图以及亮度复原的照度图,二者融合后获得最终的清晰图像。本发明可以有效去除人工光源造成的非均匀光照问题,很好地复原图像的对比度和色彩信息,显著改善水下图像质量,在复杂的海洋环境中具有优异的鲁棒性、准确性和普适性。

    一种基于多模态特征融合的无人船自动控制方法

    公开(公告)号:CN119717801A

    公开(公告)日:2025-03-28

    申请号:CN202411802253.0

    申请日:2024-12-09

    Abstract: 本发明公开了一种基于多模态特征融合的无人船自动控制方法,包括:获取多视角RGB图像和雷达数据图像,分别进行BEV特征提取,从而得到视觉BEV特征和雷达BEV特征;对视觉BEV特征和雷达BEV特征进行编码融合;通过目标感知器对所述融合BEV特征进行目标检测,从而获取有效目标特征;通过运动预测模块预测有效目标的未来轨迹;将组合生成的聚合计划查询与融合BEV特征进行交互,进行无人船最终轨迹点的预测;基于无人船最终轨迹点,通过PID控制生成无人船运行指令。本方法引入雷达数据作为辅助模态特征,将RGB图像数据和雷达数据进行BEV特征融合,根据自身船查询与融合BEV特征进行多层感知来预测最终的航迹点,从而生成无人船的实时控制指令。

    一种基于场景深度信息的偏振水下图像优化方法

    公开(公告)号:CN112907472B

    公开(公告)日:2024-08-09

    申请号:CN202110181997.5

    申请日:2021-02-09

    Abstract: 本发明公开了一种基于场景深度信息的偏振水下图像优化方法,提出一种深度信息引导下的背景区域定位策略,通过提取场景深度信息,根据场景深度信息在原始偏振图像中自动定位背景区域,进而估计出准确的后向散射光和全局后向散射光,以此来避免人为选取时的个体差异,提高定位准确度。同时,为了抑制噪声的影响,在求解时加入了噪声抑制因子,并利用了一种PSO优化策略通过寻找最优的参数来估计背景光,操作方便、效率更高,能够准确的估计最优的背景光,使图像增强效果更佳。

Patent Agency Ranking