-
公开(公告)号:CN116402701A
公开(公告)日:2023-07-07
申请号:CN202310131778.5
申请日:2023-02-17
Applicant: 武汉大学
IPC: G06T5/00 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于景深信息成雾和Transformer网络的图像去雾方法及系统,该方法包括:利用大气散射模型和深度估计的方法构建训练集,构建特征串联模块和编码‑分支解码模块,所述特征串联模块用于提取输入图像的高维特征,所述编码‑分支解码模块对提取出的高维特征进行重建,得到生成的无雾图像;构建去雾网络模型及对应的损失函数,利用训练集对所述去雾网络模型进行训练,所述去雾网络模型包括特征串联模块和编码‑分支解码模块;利用训练好的去雾网络模型完成图像去雾。本发明通过在主流数据集上的大量实验表明所提出的方法实现了最先进的去雾结果。
-
公开(公告)号:CN115661857A
公开(公告)日:2023-01-31
申请号:CN202211239389.6
申请日:2022-10-11
Applicant: 武汉大学
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于三模态一致性约束的跨模态行人再识别方法和系统,该方法包括:构建行人识别模型;融合彩色和红外图像,产生增强样本;将彩色、红外和增强图像输入模型,提取图像特征图;实施池化操作获取图像的整体和局部特征,输入分类器完成分类任务;构建三元中心损失,减少模态间的特征差异;构建紧致的模态内约束,减少模态内的特征差异;联合交叉熵、三元中心损失和紧致的模态内约束,优化行人识别模型;测试应用阶段,提取行人的整体与局部特征,并将其串联进行行人匹配,得到识别结果。本发明充分利用红外和彩色图像信息,产生增强图像减少模态间差异,构建损失解决模态内和模态间差异大问题,提高了跨模态行人再识别的匹配正确率。
-
公开(公告)号:CN117636108A
公开(公告)日:2024-03-01
申请号:CN202311452355.X
申请日:2023-11-01
Applicant: 武汉大学
IPC: G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于交互式Transformer的红外和可见光图像融合方法及系统。首先构建红外和可见光图像融合模型:将红外和可见光图像分别输入N个特征交互模块提取源图像各自的独有特征;同时,将红外和可见光图像在通道维度上拼接,输入N个特征交互模块提取源图像的共同特征;独有特征和共同特征通过交互注意力进行特征的交互和整合;输入特征重构模块完成图像融合任务;构建损失函数优化融合模型;测试应用阶段,提取红外和可见光图像的互补特征,摒弃冗余特征,得到融合结果。本发明充分整合红外和可见光图像的独有特征和共有特征,生成信息丰富的融合图像,提高了红外和可见光图像融合的性能。
-
公开(公告)号:CN114821661A
公开(公告)日:2022-07-29
申请号:CN202210533483.6
申请日:2022-05-13
Applicant: 武汉大学
IPC: G06V40/10 , G06V10/40 , G06V10/762 , G06K9/62 , G06N20/00
Abstract: 本发明提供一种无监督行人再识别方法、装置、设备及可读存储介质。该方法包括:对行人图像样本进行聚类,基于聚类结果分别为每张行人图像样本分配一个假标签;构建类别特征存储器和特征存储器;根据假标签获取K*P张行人图像样本;将预处理后的K*P张行人图像样本输入深度学习模型,得到第二行人特征;基于类别特征存储器、特征存储器以及第二行人特征优化深度学习模型;当优化次数达到预设次数时,以最终得到的深度学习模型得到目标行人图像对应的行人特征,将目标行人图像对应的行人特征与数据库中的行人特征进行匹配,得到行人识别结果。通过本发明,解决了现有技术中行人再识别的识别结果准确率较低的技术问题。
-
公开(公告)号:CN117635464A
公开(公告)日:2024-03-01
申请号:CN202311865647.6
申请日:2023-12-28
Applicant: 武汉大学
IPC: G06T5/50 , G06T3/4038 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了基于功能‑解剖Transformer的多模态医学图像融合方法及系统。首先构建多模态医学融合模型:对SPECT图像进行RGB‑YUV颜色空间转换,得到Y,U和V三个分量;将Y分量输入功能多尺度分支提取多尺度功能特征;同时,将MRI输入解剖多尺度分支提取多尺度解剖特征;设计功能引导的Transformer模块和解剖引导的Transformer模块交互多尺度功能特征和多尺度解剖特征;整合并重构提取的多尺度功能特征和多尺度解剖特征,得到融合图像的Y分量;构建像素损失和梯度损失,约束融合图像与源图像有相似的像素信息以及引导融合图像与源图像有相似的梯度分布;联合像素损失和梯度损失,共同优化构建的多模态医学图像融合模型;测试阶段,基于优化的多模态医学图像融合模型,得到融合结果。
-
公开(公告)号:CN114821661B
公开(公告)日:2024-11-15
申请号:CN202210533483.6
申请日:2022-05-13
Applicant: 武汉大学
IPC: G06V40/10 , G06V10/40 , G06V10/762 , G06N20/00
Abstract: 本发明提供一种无监督行人再识别方法、装置、设备及可读存储介质。该方法包括:对行人图像样本进行聚类,基于聚类结果分别为每张行人图像样本分配一个假标签;构建类别特征存储器和特征存储器;根据假标签获取K*P张行人图像样本;将预处理后的K*P张行人图像样本输入深度学习模型,得到第二行人特征;基于类别特征存储器、特征存储器以及第二行人特征优化深度学习模型;当优化次数达到预设次数时,以最终得到的深度学习模型得到目标行人图像对应的行人特征,将目标行人图像对应的行人特征与数据库中的行人特征进行匹配,得到行人识别结果。通过本发明,解决了现有技术中行人再识别的识别结果准确率较低的技术问题。
-
-
-
-
-