通过熵最大化进行风格词多样化以实现域泛化的方法

    公开(公告)号:CN118587723B

    公开(公告)日:2024-10-01

    申请号:CN202411069095.2

    申请日:2024-08-06

    Abstract: 本发明属于计算机视觉图像处理技术领域,公开一种通过熵最大化进行风格词多样化以实现域泛化的方法,分为两个阶段,第一阶段学习风格词,产生多样化风格词提示;第二阶段利用生成的多样化风格词提示作为CLIP文本编码器的输入,在特征空间内模拟视觉特征的多样性,引导图像编码器学习域不变特征,实现遥感目标识别的域泛化。本发明利用预训练的CLIP模型帮助分类网络在仅使用一个源域数据的情况下学习域不变特征。在第一阶段通过风格多样性约束和熵最大化约束生成包含多种风格的风格词提示;在第二阶段利用风格词提示在特征空间内模拟视觉特征的多样性,降低了分类网络对多样化图像数据的依赖性,提高了分类网络的域泛化性能。

    目标跨模态表达辅助的遥感场景文本-图像生成方法

    公开(公告)号:CN118587327B

    公开(公告)日:2024-10-01

    申请号:CN202411070980.2

    申请日:2024-08-06

    Abstract: 本发明属于图像信息处理技术领域,公开了一种目标跨模态表达辅助的遥感场景文本‑图像生成方法。本方法先利用预训练图像文本联合表达模型的跨模态特征关联能力,为目标图像条件自适应地匹配对应的文本模态表达,通过目标图像到目标文本的跨模态转化避免布局的不确定性对目标信息引入产生的干扰;再将目标文本特征与原文本条件特征进行集成,利用目标信息对文本条件进行修饰与扩充;最后经补充的文本特征作为控制条件引入图像生成流程,对生成图像进行调控。本发明在避免额外布局先验引入的同时,有效实现利用图像目标条件对生成图像中目标局部的针对性增强。

    深度特征相关性矩阵的红外和可见光图像融合方法

    公开(公告)号:CN118552823A

    公开(公告)日:2024-08-27

    申请号:CN202411025648.4

    申请日:2024-07-30

    Abstract: 本发明属于图像信息处理技术领域,公开了一种深度特征相关性矩阵的红外和可见光图像融合方法。该红外和可见光图像融合方法对应的融合框架主要由自重构源图像任务、交叉重构源图像任务和分割任务组成;其中,源图像是红外图像和可见图像;自重构源图像任务和交叉重构源图像任务用于约束融合框架获得融合和重构能力;交叉重构源图像任务中引用动态交互融合;分割任务用于提供目标语义特征嵌入到动态交互融合过程,帮助融合特征提供目标语义信息;提出跨任务交互模块构建深度特征相关性矩阵来解决两个不同层级任务在特征融合过程中存在的语义差异问题。本发明能够使得融合特征包含丰富的目标语义信息,进而重构出高质量的融合图像。

    一种鲁棒的红外和可见光图像融合优化方法

    公开(公告)号:CN117952845A

    公开(公告)日:2024-04-30

    申请号:CN202410064745.8

    申请日:2024-01-17

    Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。

    一种基于目标检测的遥感图像变形下采样方法

    公开(公告)号:CN117952824A

    公开(公告)日:2024-04-30

    申请号:CN202410348970.4

    申请日:2024-03-26

    Abstract: 本发明属于深度学习技术领域,公开了一种基于目标检测的遥感图像变形下采样方法,提出一种混合高斯变形模块,用于生成变形下采样的遥感图像;根据混合高斯变形模块与下游的相关性,将高分辨率图像自适应为变形的低分辨率图像目标检测任务;混合高斯变形模块由高斯密度网络、变形下采样网格生成网络和可变形采样器三部分组成。本发明研究了大尺度高分辨率图像遥感目标检测的速度和准确度相平衡的问题,并提出一种有效的旨在减少计算负荷的同时提高检测性能的方法。本发明通过该方法推动深度学习技术在遥感目标检测领域的效率问题处理上取得突破性进展。

    目标跨模态表达辅助的遥感场景文本-图像生成方法

    公开(公告)号:CN118587327A

    公开(公告)日:2024-09-03

    申请号:CN202411070980.2

    申请日:2024-08-06

    Abstract: 本发明属于图像信息处理技术领域,公开了一种目标跨模态表达辅助的遥感场景文本‑图像生成方法。本方法先利用预训练图像文本联合表达模型的跨模态特征关联能力,为目标图像条件自适应地匹配对应的文本模态表达,通过目标图像到目标文本的跨模态转化避免布局的不确定性对目标信息引入产生的干扰;再将目标文本特征与原文本条件特征进行集成,利用目标信息对文本条件进行修饰与扩充;最后经补充的文本特征作为控制条件引入图像生成流程,对生成图像进行调控。本发明在避免额外布局先验引入的同时,有效实现利用图像目标条件对生成图像中目标局部的针对性增强。

    关系感知度量的跨域少样本遥感目标分类方法

    公开(公告)号:CN118570562A

    公开(公告)日:2024-08-30

    申请号:CN202411045601.4

    申请日:2024-08-01

    Abstract: 本发明属于图像信息处理技术领域,公开了一种关系感知度量的跨域少样本遥感目标分类方法,首先,源域训练数据集#imgabs0#被划分为伪支持集#imgabs1#与伪查询集#imgabs2#,使用伪支持集样本与伪查询样本的特征拼接,构建关系感知特征对,在源域特征处理分支内优化模型以形成类内紧凑、类间分散的特征空间。在源域特征处理分支与伪新域特征处理分支间对齐关系感知度量而得到域不变的特征空间,使得跨域少样本遥感目标分类性能提升。本发明提出关系感知度量以比较类内、类间关系。本发明提出了一种通用的语义相似度基准来分配伪标签以优化关系感知度量,克服了以往方法在不同新域下性能下降的缺点。

    一种多样性提示学习的少样本遥感目标识别泛化性的方法

    公开(公告)号:CN118097442A

    公开(公告)日:2024-05-28

    申请号:CN202410523937.0

    申请日:2024-04-29

    Abstract: 本发明属于计算机视觉图像处理技术领域,一种多样性提示学习的少样本遥感目标识别泛化性的方法。用图像文本多模态的方式进行训练,将多个含有可学习的提示的文本向量输入参数固定的文本编码器得到文本特征,将图像输入到参数固定的图像编码器得到图像特征,用分类损失和风格多样性损失更新提示参数,直至DPL模型收敛。本发明在原CLIP模型的改进模型CoOp的基础上,增加多个不同的提示来提高文本风格描述的多样性。为使风格描述间互相远离,提出风格多样性损失,用使提示特征两两正交的方式使提示特征相互远离,从而提升模型的泛化性。为了使文本风格描述不偏离原始图像类别信息,用分类损失加以约束。本发明的方法提升了少样本遥感图像识别的泛化性。

Patent Agency Ranking