一种多样性提示学习的少样本遥感目标识别泛化性的方法

    公开(公告)号:CN118097442B

    公开(公告)日:2024-07-05

    申请号:CN202410523937.0

    申请日:2024-04-29

    Abstract: 本发明属于计算机视觉图像处理技术领域,一种多样性提示学习的少样本遥感目标识别泛化性的方法。用图像文本多模态的方式进行训练,将多个含有可学习的提示的文本向量输入参数固定的文本编码器得到文本特征,将图像输入到参数固定的图像编码器得到图像特征,用分类损失和风格多样性损失更新提示参数,直至DPL模型收敛。本发明在原CLIP模型的改进模型CoOp的基础上,增加多个不同的提示来提高文本风格描述的多样性。为使风格描述间互相远离,提出风格多样性损失,用使提示特征两两正交的方式使提示特征相互远离,从而提升模型的泛化性。为了使文本风格描述不偏离原始图像类别信息,用分类损失加以约束。本发明的方法提升了少样本遥感图像识别的泛化性。

    一种鲁棒的红外和可见光图像融合优化方法

    公开(公告)号:CN117952845A

    公开(公告)日:2024-04-30

    申请号:CN202410064745.8

    申请日:2024-01-17

    Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。

    一种基于目标检测的遥感图像变形下采样方法

    公开(公告)号:CN117952824A

    公开(公告)日:2024-04-30

    申请号:CN202410348970.4

    申请日:2024-03-26

    Abstract: 本发明属于深度学习技术领域,公开了一种基于目标检测的遥感图像变形下采样方法,提出一种混合高斯变形模块,用于生成变形下采样的遥感图像;根据混合高斯变形模块与下游的相关性,将高分辨率图像自适应为变形的低分辨率图像目标检测任务;混合高斯变形模块由高斯密度网络、变形下采样网格生成网络和可变形采样器三部分组成。本发明研究了大尺度高分辨率图像遥感目标检测的速度和准确度相平衡的问题,并提出一种有效的旨在减少计算负荷的同时提高检测性能的方法。本发明通过该方法推动深度学习技术在遥感目标检测领域的效率问题处理上取得突破性进展。

    一种鲁棒的红外和可见光图像融合优化方法

    公开(公告)号:CN117952845B

    公开(公告)日:2024-08-06

    申请号:CN202410064745.8

    申请日:2024-01-17

    Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。

    域对抗的遥感图像目标分类方法

    公开(公告)号:CN116912593B

    公开(公告)日:2024-01-23

    申请号:CN202310950762.7

    申请日:2023-07-31

    Abstract: 本发明属于计算机视觉图像处理技术领域,公开了一种域对抗的遥感图像目标分类方法。通过多种遥感图像数据集以及训练损失训练域编码器和域分类器;输入某个域样本至类别编码器,输入同类别的另一域样本至域编码器中;固定域编码器、域分类器和生成器,通过分类损失、对抗损失和数据增强损失训练类别编码器和分类器。通过第一步训练,训练出好的域编码器和域分类器,为第二步训练提供辅助训练网络;第二步训练通过第一步训练好的域分类器与类别编码器进行对抗,提升类别编码器的域泛化效果,再通过第一步训练好的域编码器充分解耦出域特征的特点,通过数据增强的训练方式使类别

    音视频跨模态特征表达的目标行为感知方法

    公开(公告)号:CN117011763A

    公开(公告)日:2023-11-07

    申请号:CN202310866413.7

    申请日:2023-07-14

    Abstract: 本发明属于视频信息处理技术领域,提出一种音视频跨模态特征表达的目标行为感知方法。该方法基于目标行为感知网络模型实现,其包括视频特征提取网络、跨模态信息融合网络和分类器。将视频数据进行空间降维后利用变换操作将信息模式转化为与音频类似的频率表示,消除了两种模态间存在的维度差异与表述差异;在此基础之上采用中间融合与后期融合相结合的方式进行音视频结合,提升跨模态信息融合效果。本方法可以简单拓展应用于其他需要借助音视频融合信息的任务中,有效解决了音频与视频的差异对于模态融合产生的影响。

Patent Agency Ranking