-
公开(公告)号:CN117173476B
公开(公告)日:2024-05-24
申请号:CN202311138188.1
申请日:2023-09-05
Applicant: 北京交通大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V40/10 , G06N3/0464 , G06N3/084
Abstract: 一种单源域泛化行人再识别模型训练方法,包括如下步骤:将预处理图像输入冻结网络和基线网络,获得冻结特征图和基线特征图;所述冻结网络的权重和所述基线网络的初始权重为预训练网络权重;将所述冻结特征图和基线特征图输入浅层特征补偿模块,改变每幅基线特征图的像素值,输出补偿基线特征图;将所述补偿基线特征图经过池化后的特征向量输入深层特征整合模块,输出一个与训练数据集中行人类别数等维的特征向量;将所述与训练数据集中行人类别数等维的特征向量输入损失计算模块,计算总损失;将总损失在基线网络中反向传播,保存收敛后的单源域泛化模型。相比于其他同领域的方法具有更高的识别准确率,提高了泛化识别性能。
-
公开(公告)号:CN116740488B
公开(公告)日:2024-01-05
申请号:CN202310550775.5
申请日:2023-05-16
Applicant: 北京交通大学
IPC: G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/46
Abstract: 的质量,从而提高了模型特征提取的质量且保持本发明涉及一种用于视觉定位的特征提取 计算成本不变。模型的训练方法,所述训练方法包括如下步骤:将无标签的原始训练集图像进行数据增强得到无标签的真实训练集图像,所述无标签的真实训练集图像包括景深图像和雾图像;根据所述真实训练集图像得到第一图像对并将其输入融合自注意力和卷积混合模块的模型得到第一特征点概率图;通过自监督的方式同时提取图像特征点和描述子,将3DCC变换应用于训练阶段,通过模拟现实世界中计算机视觉模型将遇到的自然分(56)对比文件杨晓云.基于卷积神经网络的视觉位置识别方法研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2021,全文.丁静.烟雾环境下运动目标双目视觉定位技术研究《.中国博士学位论文全文数据库 信息科技辑》.2023,全文.
-
公开(公告)号:CN117173525A
公开(公告)日:2023-12-05
申请号:CN202311138474.8
申请日:2023-09-05
Applicant: 北京交通大学
IPC: G06V10/80 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种通用型多模态图像融合方法,包括基于预处理网络将同一场景下精配准的多模态图像进行预处理得到初始图像、基于编码器网络将所述初始图像进行特征提取得到多尺度特征和基于解码器网络将所述多尺度特征进行特征重建得到融合图像,所述编码器网络包括i+1个依次连接的Transformer模块,且所述前i个Transformer模块后均连接有小波下采样模块,其中,i∈{1,2,3,4};避免了对融合策略的依赖,更适合于不同的多模态图像融合任务,充分保留了源图像的低频结构,并加强了高频信息的感知,可以弥补单一模态信息表征不足的局限性,实现高质量多模态图像融合效果,增加图像融合方法的实用性和泛化性。
-
公开(公告)号:CN111488797B
公开(公告)日:2023-12-05
申请号:CN202010165628.2
申请日:2020-03-11
Applicant: 北京交通大学
IPC: G06V40/10 , G06V10/80 , G06V10/774 , G06N3/0464
Abstract: 本发明涉及一种行人再识别方法,包括步骤1、调整原始行人图像尺寸,进行预处理;2、将预处理后的图像输入MEMF模型进行前向传播,输出四个特征向量;3、计算一次训练的总损失;4、根据总损失进行反向传播,更新并保存网络权重;5、将网络权重作为下一次模型训练的初始网络权重,重复步骤2‑4,保存最后一次训练后的模型;6、调整检索图像和图像库中图像的大小并归一化;7、归一化后输入训练好的模型,每幅图像得到四个等维的特征表达向量;8、将每幅图像的四个特征表达向量级联作为最终特征表达向量;9、计算检索图像和图像库图像的最终特征表达向量间的欧氏距离,从小到大排序;10、根据排序,输出对应序列图像作为识别结果。
-
公开(公告)号:CN116385265B
公开(公告)日:2023-10-17
申请号:CN202310360499.6
申请日:2023-04-06
Applicant: 北京交通大学
IPC: G06T3/40 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种图像超分辨率网络的训练方法,所述图像超分辨率网络包括浅层特征提取子网、深层特征提取子网、特征融合子网和图像重建子网,所述深层特征提取子网包括若干个混合注意力模块,所述特征融合子网包括若干个神经窗口全连接条件随机场模块,该训练方法包括将低分辨率图像输入所述图像超分辨率网络对其进行训练的训练步骤;创新性地将条件随机场的思想加入到图像超分辨率模型中,通过像素点与像素点间联系对特征进行约束,进行特征融合,通过混合注意力模块,其结合了移位窗口自注意力、空间注意力及通道注意力,利用它们的互补优势,克服了移位窗口机制因输入像素少,对网络性能提升产生的限制,保留了较强的局部特征表征能力。
-
公开(公告)号:CN118486048B
公开(公告)日:2025-03-21
申请号:CN202410582240.0
申请日:2024-05-11
Applicant: 北京交通大学
IPC: G06V40/10 , G06V20/52 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/084
Abstract: 本发明一种基于双重元学习模型的域泛化行人再识别方法,S1:将原始图像输入到元训练模型训练,计算元训练阶段的损失;S2:将与S1中输入的原始图像的不同类别的图像输入到类别元测试模型,计算类别元测试阶段的损失,将其与所述元训练阶段的损失相加作为类别元测试阶段的总损失;S3:将S2中输入的图像输入到风格元测试模型,计算风格元测试阶段的损失,与类别元测试阶段的总损失相加作为总损失,本发明的有益效果在于,过分别进行类别元测试阶段和风格元测试阶段,充分模拟未知域中行人类别和图像风格的变化,提升模型的泛化性能。
-
公开(公告)号:CN117746014B
公开(公告)日:2025-03-04
申请号:CN202311675687.4
申请日:2023-12-07
Applicant: 北京交通大学
IPC: G06V10/25 , G06V20/13 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/764
Abstract: 本发明涉及一种融合电磁散射特征的SAR图像目标识别方法和系统,所述SAR图像目标识别方法包括如下步骤:将SAR测试图像基于深度卷积神经网络生成第一中间特征图,将所述SAR测试图像与所述第一中间特征图输入图像分类网络得到识别结果;其中,获得所述深度卷积神经网络的模型参数的方法包括如下步骤:将SAR训练图像基于属性散射中心模型生成属性散射中心图像,将所述SAR训练图像基于深度卷积神经网络生成重构的属性散射中心图像,基于所述属性散射中心图像和所述重构的属性散射中心图像得到所述深度卷积神经网络的模型参数。本发明创新性地采用蒸馏模型的思想来进行电磁散射特征的提取,并采用全局注意力的思想融合电磁散射特征进行SAR图像目标识别。
-
公开(公告)号:CN111881714B
公开(公告)日:2023-11-21
申请号:CN202010438989.X
申请日:2020-05-22
Applicant: 北京交通大学
IPC: G06V40/10 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/088 , G06N3/084
-
公开(公告)号:CN116385265A
公开(公告)日:2023-07-04
申请号:CN202310360499.6
申请日:2023-04-06
Applicant: 北京交通大学
IPC: G06T3/40 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种图像超分辨率网络的训练方法,所述图像超分辨率网络包括浅层特征提取子网、深层特征提取子网、特征融合子网和图像重建子网,所述深层特征提取子网包括若干个混合注意力模块,所述特征融合子网包括若干个神经窗口全连接条件随机场模块,该训练方法包括将低分辨率图像输入所述图像超分辨率网络对其进行训练的训练步骤;创新性地将条件随机场的思想加入到图像超分辨率模型中,通过像素点与像素点间联系对特征进行约束,进行特征融合,通过混合注意力模块,其结合了移位窗口自注意力、空间注意力及通道注意力,利用它们的互补优势,克服了移位窗口机制因输入像素少,对网络性能提升产生的限制,保留了较强的局部特征表征能力。
-
公开(公告)号:CN111488797A
公开(公告)日:2020-08-04
申请号:CN202010165628.2
申请日:2020-03-11
Applicant: 北京交通大学
Abstract: 本发明涉及一种行人再识别方法,包括步骤1、调整原始行人图像尺寸,进行预处理;2、将预处理后的图像输入MEMF模型进行前向传播,输出四个特征向量;3、计算一次训练的总损失;4、根据总损失进行反向传播,更新并保存网络权重;5、将网络权重作为下一次模型训练的初始网络权重,重复步骤2-4,保存最后一次训练后的模型;6、调整检索图像和图像库中图像的大小并归一化;7、归一化后输入训练好的模型,每幅图像得到四个等维的特征表达向量;8、将每幅图像的四个特征表达向量级联作为最终特征表达向量;9、计算检索图像和图像库图像的最终特征表达向量间的欧氏距离,从小到大排序;10、根据排序,输出对应序列图像作为识别结果。
-
-
-
-
-
-
-
-
-