-
公开(公告)号:CN118587723B
公开(公告)日:2024-10-01
申请号:CN202411069095.2
申请日:2024-08-06
Applicant: 大连理工大学
IPC: G06V30/19
Abstract: 本发明属于计算机视觉图像处理技术领域,公开一种通过熵最大化进行风格词多样化以实现域泛化的方法,分为两个阶段,第一阶段学习风格词,产生多样化风格词提示;第二阶段利用生成的多样化风格词提示作为CLIP文本编码器的输入,在特征空间内模拟视觉特征的多样性,引导图像编码器学习域不变特征,实现遥感目标识别的域泛化。本发明利用预训练的CLIP模型帮助分类网络在仅使用一个源域数据的情况下学习域不变特征。在第一阶段通过风格多样性约束和熵最大化约束生成包含多种风格的风格词提示;在第二阶段利用风格词提示在特征空间内模拟视觉特征的多样性,降低了分类网络对多样化图像数据的依赖性,提高了分类网络的域泛化性能。
-
公开(公告)号:CN118587327B
公开(公告)日:2024-10-01
申请号:CN202411070980.2
申请日:2024-08-06
Applicant: 大连理工大学
IPC: G06T11/60 , G06V30/19 , G06V10/82 , G06N3/0475 , G06N3/094
Abstract: 本发明属于图像信息处理技术领域,公开了一种目标跨模态表达辅助的遥感场景文本‑图像生成方法。本方法先利用预训练图像文本联合表达模型的跨模态特征关联能力,为目标图像条件自适应地匹配对应的文本模态表达,通过目标图像到目标文本的跨模态转化避免布局的不确定性对目标信息引入产生的干扰;再将目标文本特征与原文本条件特征进行集成,利用目标信息对文本条件进行修饰与扩充;最后经补充的文本特征作为控制条件引入图像生成流程,对生成图像进行调控。本发明在避免额外布局先验引入的同时,有效实现利用图像目标条件对生成图像中目标局部的针对性增强。
-
公开(公告)号:CN118552823A
公开(公告)日:2024-08-27
申请号:CN202411025648.4
申请日:2024-07-30
Applicant: 大连理工大学
IPC: G06V10/80 , G06V10/82 , G06V10/26 , G06N3/0455 , G06N3/0464
Abstract: 本发明属于图像信息处理技术领域,公开了一种深度特征相关性矩阵的红外和可见光图像融合方法。该红外和可见光图像融合方法对应的融合框架主要由自重构源图像任务、交叉重构源图像任务和分割任务组成;其中,源图像是红外图像和可见图像;自重构源图像任务和交叉重构源图像任务用于约束融合框架获得融合和重构能力;交叉重构源图像任务中引用动态交互融合;分割任务用于提供目标语义特征嵌入到动态交互融合过程,帮助融合特征提供目标语义信息;提出跨任务交互模块构建深度特征相关性矩阵来解决两个不同层级任务在特征融合过程中存在的语义差异问题。本发明能够使得融合特征包含丰富的目标语义信息,进而重构出高质量的融合图像。
-
公开(公告)号:CN118552424A
公开(公告)日:2024-08-27
申请号:CN202411025584.8
申请日:2024-07-30
Applicant: 大连理工大学
Abstract: 本发明属于图像信息处理技术领域,公开了一种像素级‑目标级特征平衡的红外与可见光图像融合方法,设计了层次化交互模块,通过将图像融合和图像分割任务在不同的层次上进行特征交互,来平衡任务之间的信息传递。该层次化交互模块包含两个关键部分:跨像素级细节特征交互模块和跨目标级语义特征交互模块。这两个模块通过不同层次的特征转换和特征交互协同工作,不仅解决了图像融合和图像分割任务之间的特征不匹配问题,而且通过充分利用任务间的互补信息,促进了特征在不同层次上的深入交互。
-
公开(公告)号:CN117952845A
公开(公告)日:2024-04-30
申请号:CN202410064745.8
申请日:2024-01-17
Applicant: 大连理工大学
IPC: G06T5/50 , G06T7/10 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。
-
公开(公告)号:CN117952824A
公开(公告)日:2024-04-30
申请号:CN202410348970.4
申请日:2024-03-26
Applicant: 大连理工大学
IPC: G06T3/18 , G06T3/4046 , G06T3/4092 , G06N3/045 , G06N3/0464
Abstract: 本发明属于深度学习技术领域,公开了一种基于目标检测的遥感图像变形下采样方法,提出一种混合高斯变形模块,用于生成变形下采样的遥感图像;根据混合高斯变形模块与下游的相关性,将高分辨率图像自适应为变形的低分辨率图像目标检测任务;混合高斯变形模块由高斯密度网络、变形下采样网格生成网络和可变形采样器三部分组成。本发明研究了大尺度高分辨率图像遥感目标检测的速度和准确度相平衡的问题,并提出一种有效的旨在减少计算负荷的同时提高检测性能的方法。本发明通过该方法推动深度学习技术在遥感目标检测领域的效率问题处理上取得突破性进展。
-
公开(公告)号:CN115222600A
公开(公告)日:2022-10-21
申请号:CN202210904585.4
申请日:2022-07-29
Applicant: 大连理工大学 , 辽宁师范大学 , 山东纬横数据科技有限公司 , 中国船舶集团有限公司第七0九研究所
Abstract: 本发明属于计算机视觉的图像处理领域,公开了一种本发明的对比学习多光谱图像超分辨重建方法。该方法的模型分为两个部分:教师模型部分和学生模型部分。教师模型用于输出遥感图像的细节特征,以便给学生模型作为监督,使学生模型能够得到图像的细节信息,从而增加图像的分辨率。此外,在学生模型中增加对比学习模块,将最终输出与真值高分辨图像作为正样本对,将输出与原始输入作为负样本对,使输出更接近高分辨率图像。本发明利用对比学习以及超分辨重建的方法,实现了低分辨率遥感图像转化为高分辨率的清晰遥感图像。同时本方法对于其他图像质量提升有关的视觉任务都具有良好的泛化性,可以作为图像质量提升问题的一种有效的解决方案。
-
公开(公告)号:CN118587327A
公开(公告)日:2024-09-03
申请号:CN202411070980.2
申请日:2024-08-06
Applicant: 大连理工大学
IPC: G06T11/60 , G06V30/19 , G06V10/82 , G06N3/0475 , G06N3/094
Abstract: 本发明属于图像信息处理技术领域,公开了一种目标跨模态表达辅助的遥感场景文本‑图像生成方法。本方法先利用预训练图像文本联合表达模型的跨模态特征关联能力,为目标图像条件自适应地匹配对应的文本模态表达,通过目标图像到目标文本的跨模态转化避免布局的不确定性对目标信息引入产生的干扰;再将目标文本特征与原文本条件特征进行集成,利用目标信息对文本条件进行修饰与扩充;最后经补充的文本特征作为控制条件引入图像生成流程,对生成图像进行调控。本发明在避免额外布局先验引入的同时,有效实现利用图像目标条件对生成图像中目标局部的针对性增强。
-
公开(公告)号:CN118570562A
公开(公告)日:2024-08-30
申请号:CN202411045601.4
申请日:2024-08-01
Applicant: 大连理工大学
IPC: G06V10/764 , G06V10/82 , G06V10/74
Abstract: 本发明属于图像信息处理技术领域,公开了一种关系感知度量的跨域少样本遥感目标分类方法,首先,源域训练数据集#imgabs0#被划分为伪支持集#imgabs1#与伪查询集#imgabs2#,使用伪支持集样本与伪查询样本的特征拼接,构建关系感知特征对,在源域特征处理分支内优化模型以形成类内紧凑、类间分散的特征空间。在源域特征处理分支与伪新域特征处理分支间对齐关系感知度量而得到域不变的特征空间,使得跨域少样本遥感目标分类性能提升。本发明提出关系感知度量以比较类内、类间关系。本发明提出了一种通用的语义相似度基准来分配伪标签以优化关系感知度量,克服了以往方法在不同新域下性能下降的缺点。
-
公开(公告)号:CN118097442A
公开(公告)日:2024-05-28
申请号:CN202410523937.0
申请日:2024-04-29
Applicant: 大连理工大学
IPC: G06V20/10 , G06V10/80 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0455 , G06N3/0895
Abstract: 本发明属于计算机视觉图像处理技术领域,一种多样性提示学习的少样本遥感目标识别泛化性的方法。用图像文本多模态的方式进行训练,将多个含有可学习的提示的文本向量输入参数固定的文本编码器得到文本特征,将图像输入到参数固定的图像编码器得到图像特征,用分类损失和风格多样性损失更新提示参数,直至DPL模型收敛。本发明在原CLIP模型的改进模型CoOp的基础上,增加多个不同的提示来提高文本风格描述的多样性。为使风格描述间互相远离,提出风格多样性损失,用使提示特征两两正交的方式使提示特征相互远离,从而提升模型的泛化性。为了使文本风格描述不偏离原始图像类别信息,用分类损失加以约束。本发明的方法提升了少样本遥感图像识别的泛化性。
-
-
-
-
-
-
-
-
-