-
公开(公告)号:CN118968565B
公开(公告)日:2024-12-20
申请号:CN202411447862.9
申请日:2024-10-17
Applicant: 昆明理工大学
IPC: G06V40/10 , G06N3/0455 , G06N3/0895 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/778 , G06V10/82
Abstract: 本发明提供基于没有配对样本的行人重识别域泛化方法,属于计算机视觉中的图像检索技术领域。本发明包括:获取数据集;学习行人身份原型;利用行人身份原型,通过对比学习的方法,学习身份相关提示,用于弥补缺失的跨相机正样本;引入一种可学习的扰动提示,将扰动提示信息注入到可学习的身份相关提示中,迫使图像编码器性能下降来更新可学习扰动提示;利用缺失跨相机正样本的数据和加入扰动提示信息的身份相关提示,通过更新图像编码器的参数,用于增强图像编码器对一致性特征的提取能力;利用累计匹配曲线CMC和平均准确度mAP两个客观评价指标评估未知域的检索结果。通过本方法,显著提升了模型在真实场景中的适用性和泛化能力。
-
公开(公告)号:CN118918046B
公开(公告)日:2024-12-06
申请号:CN202411378707.6
申请日:2024-09-30
Applicant: 昆明理工大学
Abstract: 本发明涉及基于内容提示和任务提示的一体化图像恢复方法,属于计算机图像处理领域。本发明包括步骤:将预处理好的退化图像输入到内容提示生成网络,用于提取高频提示和低频提示再合并为内容提示;将预处理好的退化图像输入到任务提示生成网络,在前向传播过程中,利用这些学习到的向量来获取任务提示;将预处理好的退化图像输入到图像恢复网络通过前向传播过程进行特征提取。同时,通过内容提示嵌入模块和任务提示嵌入模块,将内容提示和任务提示嵌入到特征中,利用内容和任务相关的信息来指导图像的恢复过程,从而恢复图像;训练内容提示生成网络、任务提示生成网络和图像恢复网络。本发明使得图像恢复过程更加高效。
-
公开(公告)号:CN113903031B
公开(公告)日:2024-11-19
申请号:CN202111069488.X
申请日:2021-09-13
Applicant: 昆明理工大学
IPC: G06V20/70 , G06V10/26 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种基于图卷积和对比学习的跨域语义分割方法,属迁移学习和计算机视觉领域。本发明设计了一种在不同域中求邻接矩阵的方法,为建立域之间的长距离上下文关系提供了一种新思路。为解决不同类别分布不平衡的问题,提出分组对比学习损失。其次,为提取到域不变的信息,本发明利用新提出到的双域邻接矩阵做图卷积操作。在进行图卷积操作的过程中,本发明在特征图上构造图结构,为了建立起域之间的长距离的上下文关系,本发明创造性的在所提出的图结构中利用所提出的双域邻接矩阵完成图卷积操作。本发明提出的方法,建立起域之间的长距离的上下文关系,且能更加有效的提取到域不变的信息,并且在主观和客观评价上获得了更优的评价结果。
-
公开(公告)号:CN115908855B
公开(公告)日:2024-08-20
申请号:CN202310028118.4
申请日:2023-01-09
Applicant: 昆明理工大学
IPC: G06V10/44 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于CNN和Transformer的素描图像‑可见光图像的检索方法,该方法包括利用多粒度特征提取网络、跨模态共有特征增强网络、多粒度交互网络构建跨模态检索模型。素描图像和可见光图像输入到基于CNN的多粒度特征提取网络得到两个模态的多粒度特征;跨模态共有特征增强网络利用跨模态注意力对多模态特征在共有特征上进行增强,这样不仅可以减小两个模态之间的差异,同时还能增强共有特征的判别性,有利于最后的检索;增强后的特征通过多粒度交互网络进行特征交互来建立多粒度特征之间的上下文关系,来增强多模态特征的判别性表示。通过本发明的方法,能有效减小模态之间的差异,提高检索的精度和效率。
-
公开(公告)号:CN114925168B
公开(公告)日:2024-08-09
申请号:CN202210567309.3
申请日:2022-05-24
Applicant: 昆明理工大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/24 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0455 , G06N3/048
Abstract: 本发明涉及基于生成对抗网络的越南语新闻事件共指关系识别方法,属自然语言处理领域。本发明的事件共指关系识别任务需要识别新闻文档中事件描述句之间是否从不同的角度对同一件真实事情展开论述。针对事件信息比实体信息复杂导致事件共指关系识别的难度远远大于实体共指消解,以及在越南语新闻文档中存在不同事件句之间具有相似上下文但不具有共指关系的情况,而容易对模型造成困惑。因此,本发明采用事件上下文作为事件句的表征,并通过生成对抗网络来缓解文本中的噪声数据,以提高面向越南语新闻的事件共指关系识别的性能。在构建的越南语事件数据集上进行实验验证,结果表明,所提方法较基线模型取得了更好的效果。
-
公开(公告)号:CN118429771A
公开(公告)日:2024-08-02
申请号:CN202410608529.5
申请日:2024-05-16
Applicant: 昆明理工大学
IPC: G06V10/80 , G06V10/764 , G06V10/52 , G06V10/54 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及基于融合‑语义特征分类器的红外与可见光图像融合方法。本发明包括:获取融合特征及融合结果;计算融合损失,优化融合子网络参数后,冻结融合子网络参数;获取红外和可见光图像的语义特征及分割结果;计算语义分割损失,优化语义分割子网络参数,冻结语义分割子网络参数;将提取的融合特征和语义特征送入融合‑语义特征分类器;计算分类损失,优化分类器参数,冻结分类器参数;提取包含丰富语义及融合信息的特征;计算分类损失,微调融合子网络编码器参数后,冻结融合子网络中编码器参数;获取融合结果;计算融合损失,微调解码器参数;本发明使融合子网络中的编码器能够提取含有丰富融合及语义信息的特征用于融合结果重构。
-
公开(公告)号:CN117893440B
公开(公告)日:2024-05-14
申请号:CN202410298586.8
申请日:2024-03-15
Applicant: 昆明理工大学
IPC: G06T5/70 , G06T5/60 , G06T5/73 , G06T5/90 , G06T7/11 , G06T7/50 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06N3/0985
Abstract: 本发明涉及基于扩散模型和景深引导生成的图像去雾方法,属于计算机图像处理领域。本发明包括步骤:获取RGB雾霾图像,并对图像进行预处理;构建去雾网络,将预处理好的雾霾图像送入去雾网络,该网络通过正向扩散过程对输入图像进行破坏,然后预测雾霾并修复出正常区域;构建深度估计网络,将预处理好的雾霾图像送入深度估计网络,该网络会将处理好的雾霾图片处理得到对应的深度图;构建分割网络,将深度图片按照景深生成掩码矩阵并作用到去雾图片上,将远景区域进行分割;构建景深引导生成网络,利用去雾图片来指导远景区域的生成并输出最终的去雾结果图。
-
公开(公告)号:CN117876282B
公开(公告)日:2024-05-14
申请号:CN202410268067.7
申请日:2024-03-08
Applicant: 昆明理工大学
IPC: G06T5/90 , H04N23/951 , G06T5/60
Abstract: 本发明涉及基于多任务交互促进的高动态范围成像方法,属于数字图像处理技术领域。本发明包括步骤:获取低动态范围图像,并对图像进行预处理;构建单曝光重建网络,将预处理好的低动态范围图像送入单曝光重建网络进行高动态范围图像的重建;构建多曝光融合网络,将预处理好的低动态范围图像序列送入多曝光融合网络进行多曝光图像的融合,从而生成高动态范围图像;构建交互学习块,让单曝光图像的曝光良好信息促进单曝光重建网络,让单曝光网络的无伪影特征促进多曝光融合网络;构建交互学习块,让两个网络相互促进;构建整合块对单曝光重建网络和多曝光融合网络的重建特征进行整合。本发明通过多任务之间的相互促进,提升了高动态范围成像的性能。
-
公开(公告)号:CN111861880B
公开(公告)日:2022-08-30
申请号:CN202010506835.X
申请日:2020-06-05
Applicant: 昆明理工大学
Abstract: 本发明涉及一种基于区域信息增强与块自注意力的图像超分与融合方法,属于数字图像处理技术领域。本方法包含源图像超分辨率分支与融合超分辨率分支。在源图像超分辨率分支中,迭代使用特征提取块提取源图像特征图,并使用密集连接以充分利用前后的特征图信息。每个特征提取块的输出还将经过区域信息增强块以探索源图像中各个物体所在的区域,这些信息将辅助融合超分辨率分支精确预测融合决策图。在融合超分辨率分支中,两张源图像拼接在一起输入,结合源图像超分辨率分支中输入的区域增强后的源图像信息,迭代使用基于块自注意力机制的融合块,以更好地区分聚焦与非聚焦区域。每个分支的最后使用亚像素卷积,产生超分辨率的源图像及融合图像。
-
公开(公告)号:CN111753684B
公开(公告)日:2022-07-08
申请号:CN202010531805.4
申请日:2020-06-11
Applicant: 昆明理工大学
IPC: G06V40/10 , G06V10/774 , G06V10/764 , G06V10/80 , G06K9/62
Abstract: 本发明提出了一种利用目标姿势进行生成的行人重识别方法,属于计算机视觉领域。本发明提出了一个在给定目标姿势和行人的情况下利用生成对抗网络来生成特定姿态下的目标行人对姿势进行归一化进而消除姿势对行人的影响。具体来说,将方法分为两部分:(1)在给定目标姿势和行人情况下利用生成对抗网络来生成在给定姿势下的行人;(2)利用生成的目标姿势的行人和真实的目标姿态行人,通过一个特征提取网络进行特征的提取,然后两者进行特征融合,形成一个特征向量。并且对真实的目标姿态行人也进行相同的操作,进而得到两个特征向量。最后,对得到的特征向量进行距离的度量并结合行人摄像头的信息。进一步提高识别性能。
-
-
-
-
-
-
-
-
-