-
公开(公告)号:CN118097442B
公开(公告)日:2024-07-05
申请号:CN202410523937.0
申请日:2024-04-29
Applicant: 大连理工大学
IPC: G06V20/10 , G06V10/80 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0455 , G06N3/0895
Abstract: 本发明属于计算机视觉图像处理技术领域,一种多样性提示学习的少样本遥感目标识别泛化性的方法。用图像文本多模态的方式进行训练,将多个含有可学习的提示的文本向量输入参数固定的文本编码器得到文本特征,将图像输入到参数固定的图像编码器得到图像特征,用分类损失和风格多样性损失更新提示参数,直至DPL模型收敛。本发明在原CLIP模型的改进模型CoOp的基础上,增加多个不同的提示来提高文本风格描述的多样性。为使风格描述间互相远离,提出风格多样性损失,用使提示特征两两正交的方式使提示特征相互远离,从而提升模型的泛化性。为了使文本风格描述不偏离原始图像类别信息,用分类损失加以约束。本发明的方法提升了少样本遥感图像识别的泛化性。
-
公开(公告)号:CN116434037B
公开(公告)日:2023-09-22
申请号:CN202310434641.7
申请日:2023-04-21
Applicant: 大连理工大学
IPC: G06V10/82 , G06V10/774 , G06N3/08 , G06N3/0464 , G06V10/764
Abstract: 本发明属于计算机视觉图像处理技术领域,提出一种基于双层优化学习的多模态遥感目标鲁棒识别方法。该方法设计了一种基于双层优化的训练方式引导模型自适应地学习需要学习的知识,同时利用调制网络对识别网络进行选择性激活,帮助识别网络学会如何更好地提取输入图像的特征表示。本发明能够充分利用现有数据深入挖掘模型的潜力,帮助模型摆脱多模态的干扰,解决模型在多模态目标数据上准确度降低的问题,让模型在有限的学习资源下获得更高的鲁棒性。
-
公开(公告)号:CN116434024B
公开(公告)日:2023-09-12
申请号:CN202310434441.1
申请日:2023-04-21
Applicant: 大连理工大学
IPC: G06V10/80 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明属于图像信息处理技术领域,公开了一种目标特征嵌入的红外与可见光图像融合方法。本方法构建一个目标特征嵌入的红外与可见光图像融合方法,解决了目标检测任务与图像融合任务不匹配的问题,让目标检测任务有效的提升了图像融合的结果,并且目标检测元特征嵌入过程仅在训练过程中使用,训练完毕后在测试阶段并没有增加额外的计算量。
-
公开(公告)号:CN117952845A
公开(公告)日:2024-04-30
申请号:CN202410064745.8
申请日:2024-01-17
Applicant: 大连理工大学
IPC: G06T5/50 , G06T7/10 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。
-
公开(公告)号:CN117952824A
公开(公告)日:2024-04-30
申请号:CN202410348970.4
申请日:2024-03-26
Applicant: 大连理工大学
IPC: G06T3/18 , G06T3/4046 , G06T3/4092 , G06N3/045 , G06N3/0464
Abstract: 本发明属于深度学习技术领域,公开了一种基于目标检测的遥感图像变形下采样方法,提出一种混合高斯变形模块,用于生成变形下采样的遥感图像;根据混合高斯变形模块与下游的相关性,将高分辨率图像自适应为变形的低分辨率图像目标检测任务;混合高斯变形模块由高斯密度网络、变形下采样网格生成网络和可变形采样器三部分组成。本发明研究了大尺度高分辨率图像遥感目标检测的速度和准确度相平衡的问题,并提出一种有效的旨在减少计算负荷的同时提高检测性能的方法。本发明通过该方法推动深度学习技术在遥感目标检测领域的效率问题处理上取得突破性进展。
-
公开(公告)号:CN117952845B
公开(公告)日:2024-08-06
申请号:CN202410064745.8
申请日:2024-01-17
Applicant: 大连理工大学
Abstract: 本发明属于图像信息处理技术领域,一种鲁棒的红外和可见光图像融合优化方法。本发明引入了图像分割来提供更多有用的语义信息,以指导图像融合任务的完成。在红外和可见光图像的融合任务上,本发明采用的元学习框架联合优化的方式,是在不同的源域上同时更新融合网络和分割网络的参数,然后在一个新的目标域上单独更新融合网络的参数,最终得到一个鲁棒性的融合模型,该模型能够在不同的域上适应和泛化。因此,本发明提出的融合方法相比于MetaFusion方法,在鲁棒性方面具有更大的优势,并且能在不同的域上适应和泛化。
-
公开(公告)号:CN117237720B
公开(公告)日:2024-04-12
申请号:CN202311201932.8
申请日:2023-09-18
Applicant: 大连理工大学 , 山东纬横数据科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/092 , G06N3/048 , G06N3/045 , G06N3/08 , G06F17/11
Abstract: 本发明属于图像信息处理技术领域,公开一种基于强化学习的标签噪声矫正图像分类方法。基于强化学习的标签噪声矫正图像分类方法,通过含有噪声标签的数据集和一个干净数据集训练分类网络,利用强化学习算法得到噪声转移矩阵;本发明利用强化学习的思想,通过策略网络和分类网络进行交互,并从小型干净的数据集上获得奖励,从而得到最优的噪声转移矩阵。根据预测的噪声转移矩阵,通过损失矫正的方法来改善网络在含有标签噪声数据集上训练的分类性能。本发明的方法能够提高网络的分类准确率。
-
公开(公告)号:CN116912593B
公开(公告)日:2024-01-23
申请号:CN202310950762.7
申请日:2023-07-31
Applicant: 大连理工大学 , 山东纬横数据科技有限公司
IPC: G06V10/764 , G06V20/10 , G06V10/82 , G06N3/094 , G06N3/09
Abstract: 本发明属于计算机视觉图像处理技术领域,公开了一种域对抗的遥感图像目标分类方法。通过多种遥感图像数据集以及训练损失训练域编码器和域分类器;输入某个域样本至类别编码器,输入同类别的另一域样本至域编码器中;固定域编码器、域分类器和生成器,通过分类损失、对抗损失和数据增强损失训练类别编码器和分类器。通过第一步训练,训练出好的域编码器和域分类器,为第二步训练提供辅助训练网络;第二步训练通过第一步训练好的域分类器与类别编码器进行对抗,提升类别编码器的域泛化效果,再通过第一步训练好的域编码器充分解耦出域特征的特点,通过数据增强的训练方式使类别
-
公开(公告)号:CN117237720A
公开(公告)日:2023-12-15
申请号:CN202311201932.8
申请日:2023-09-18
Applicant: 大连理工大学 , 山东纬横数据科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/092 , G06N3/048 , G06N3/045 , G06N3/08 , G06F17/11
Abstract: 本发明属于图像信息处理技术领域,公开一种基于强化学习的标签噪声矫正图像分类方法。基于强化学习的标签噪声矫正图像分类方法,通过含有噪声标签的数据集和一个干净数据集训练分类网络,利用强化学习算法得到噪声转移矩阵;本发明利用强化学习的思想,通过策略网络和分类网络进行交互,并从小型干净的数据集上获得奖励,从而得到最优的噪声转移矩阵。根据预测的噪声转移矩阵,通过损失矫正的方法来改善网络在含有标签噪声数据集上训练的分类性能。本发明的方法能够提高网络的分类准确率。
-
公开(公告)号:CN117011763A
公开(公告)日:2023-11-07
申请号:CN202310866413.7
申请日:2023-07-14
Applicant: 大连理工大学 , 山东纬横数据科技有限公司
IPC: G06V20/40 , G06V10/82 , G06N3/0464 , G06V10/86 , G06V10/764
Abstract: 本发明属于视频信息处理技术领域,提出一种音视频跨模态特征表达的目标行为感知方法。该方法基于目标行为感知网络模型实现,其包括视频特征提取网络、跨模态信息融合网络和分类器。将视频数据进行空间降维后利用变换操作将信息模式转化为与音频类似的频率表示,消除了两种模态间存在的维度差异与表述差异;在此基础之上采用中间融合与后期融合相结合的方式进行音视频结合,提升跨模态信息融合效果。本方法可以简单拓展应用于其他需要借助音视频融合信息的任务中,有效解决了音频与视频的差异对于模态融合产生的影响。
-
-
-
-
-
-
-
-
-