一种基于弱监督语义分割和特征弥补的类间遮挡目标检测网络模型的训练方法

    公开(公告)号:CN116503603B

    公开(公告)日:2024-02-23

    申请号:CN202310550746.9

    申请日:2023-05-16

    Abstract: 一种基于弱监督语义分割和特征弥补的类间遮挡目标检测网络模型的训练方法,所述弱监督语义分割和特征弥补的类间遮挡目标检测网络模型包括卷积神经网络、弱监督语义分割模块、特征弥补模块,包括如下步骤:将预处理原始图输入卷积神经网络进行特征提取,获得若干检测层的若干输出特征图;将所述若干输出特征图输入弱监督语义分割模块进行特征优化获得卷积神经网络的损失函数L0和分割损失函数Lseg,将优化后的特征图输入特征弥补模块获得弥补损失函数Lre,将所有损失叠加得到总体损失并进行反向传播,更新网络权重,直至网络收敛。分别从数据增强、特征提取、特征空间这三个方面进行优化,提高了检测目标被遮挡时的识别精度。

    一种基于弱监督语义分割和特征弥补的类间遮挡目标检测网络模型的训练方法

    公开(公告)号:CN116503603A

    公开(公告)日:2023-07-28

    申请号:CN202310550746.9

    申请日:2023-05-16

    Abstract: 一种基于弱监督语义分割和特征弥补的类间遮挡目标检测网络模型的训练方法,所述弱监督语义分割和特征弥补的类间遮挡目标检测网络模型包括卷积神经网络、弱监督语义分割模块、特征弥补模块,包括如下步骤:将预处理原始图输入卷积神经网络进行特征提取,获得若干检测层的若干输出特征图;将所述若干输出特征图输入弱监督语义分割模块进行特征优化获得卷积神经网络的损失函数L0和分割损失函数Lseg,将优化后的特征图输入特征弥补模块获得弥补损失函数Lre,将所有损失叠加得到总体损失并进行反向传播,更新网络权重,直至网络收敛。分别从数据增强、特征提取、特征空间这三个方面进行优化,提高了检测目标被遮挡时的识别精度。

    一种无监督跨域行人再识别方法
    3.
    发明公开

    公开(公告)号:CN111881714A

    公开(公告)日:2020-11-03

    申请号:CN202010438989.X

    申请日:2020-05-22

    Abstract: 本发明涉及一种无监督跨域行人再识别方法,包括如下步骤:使用有标签源域训练图像进行预训练,得到基线网络权重,将其作为多损失优化学习训练过程的基线网络初始权重;使用无标签目标域训练图像进行多损失优化学习训练,在基线网络初始权重的基础上,进行多次多损失优化学习训练,得到多损失优化学习训练后的基线网络;使用无标签目标域测试图像进行无监督跨域行人再识别测试,将无标签目标域测试图像输入多损失优化学习训练后的基线网络进行测试,得到识别结果。本发明,关注目标域图像内部的自然相似性,避免完全依赖伪标签,相比于其他同领域的方法具有更高的识别准确率。

    一种单源域泛化行人再识别方法

    公开(公告)号:CN117173476B

    公开(公告)日:2024-05-24

    申请号:CN202311138188.1

    申请日:2023-09-05

    Abstract: 一种单源域泛化行人再识别模型训练方法,包括如下步骤:将预处理图像输入冻结网络和基线网络,获得冻结特征图和基线特征图;所述冻结网络的权重和所述基线网络的初始权重为预训练网络权重;将所述冻结特征图和基线特征图输入浅层特征补偿模块,改变每幅基线特征图的像素值,输出补偿基线特征图;将所述补偿基线特征图经过池化后的特征向量输入深层特征整合模块,输出一个与训练数据集中行人类别数等维的特征向量;将所述与训练数据集中行人类别数等维的特征向量输入损失计算模块,计算总损失;将总损失在基线网络中反向传播,保存收敛后的单源域泛化模型。相比于其他同领域的方法具有更高的识别准确率,提高了泛化识别性能。

    一种用于视觉定位的特征提取模型的训练方法及装置

    公开(公告)号:CN116740488B

    公开(公告)日:2024-01-05

    申请号:CN202310550775.5

    申请日:2023-05-16

    Abstract: 的质量,从而提高了模型特征提取的质量且保持本发明涉及一种用于视觉定位的特征提取 计算成本不变。模型的训练方法,所述训练方法包括如下步骤:将无标签的原始训练集图像进行数据增强得到无标签的真实训练集图像,所述无标签的真实训练集图像包括景深图像和雾图像;根据所述真实训练集图像得到第一图像对并将其输入融合自注意力和卷积混合模块的模型得到第一特征点概率图;通过自监督的方式同时提取图像特征点和描述子,将3DCC变换应用于训练阶段,通过模拟现实世界中计算机视觉模型将遇到的自然分(56)对比文件杨晓云.基于卷积神经网络的视觉位置识别方法研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2021,全文.丁静.烟雾环境下运动目标双目视觉定位技术研究《.中国博士学位论文全文数据库 信息科技辑》.2023,全文.

    一种通用型多模态图像融合方法及装置

    公开(公告)号:CN117173525A

    公开(公告)日:2023-12-05

    申请号:CN202311138474.8

    申请日:2023-09-05

    Abstract: 本发明涉及一种通用型多模态图像融合方法,包括基于预处理网络将同一场景下精配准的多模态图像进行预处理得到初始图像、基于编码器网络将所述初始图像进行特征提取得到多尺度特征和基于解码器网络将所述多尺度特征进行特征重建得到融合图像,所述编码器网络包括i+1个依次连接的Transformer模块,且所述前i个Transformer模块后均连接有小波下采样模块,其中,i∈{1,2,3,4};避免了对融合策略的依赖,更适合于不同的多模态图像融合任务,充分保留了源图像的低频结构,并加强了高频信息的感知,可以弥补单一模态信息表征不足的局限性,实现高质量多模态图像融合效果,增加图像融合方法的实用性和泛化性。

    一种行人再识别方法
    7.
    发明授权

    公开(公告)号:CN111488797B

    公开(公告)日:2023-12-05

    申请号:CN202010165628.2

    申请日:2020-03-11

    Abstract: 本发明涉及一种行人再识别方法,包括步骤1、调整原始行人图像尺寸,进行预处理;2、将预处理后的图像输入MEMF模型进行前向传播,输出四个特征向量;3、计算一次训练的总损失;4、根据总损失进行反向传播,更新并保存网络权重;5、将网络权重作为下一次模型训练的初始网络权重,重复步骤2‑4,保存最后一次训练后的模型;6、调整检索图像和图像库中图像的大小并归一化;7、归一化后输入训练好的模型,每幅图像得到四个等维的特征表达向量;8、将每幅图像的四个特征表达向量级联作为最终特征表达向量;9、计算检索图像和图像库图像的最终特征表达向量间的欧氏距离,从小到大排序;10、根据排序,输出对应序列图像作为识别结果。

    一种图像超分辨率网络的训练方法及装置

    公开(公告)号:CN116385265B

    公开(公告)日:2023-10-17

    申请号:CN202310360499.6

    申请日:2023-04-06

    Abstract: 本发明涉及一种图像超分辨率网络的训练方法,所述图像超分辨率网络包括浅层特征提取子网、深层特征提取子网、特征融合子网和图像重建子网,所述深层特征提取子网包括若干个混合注意力模块,所述特征融合子网包括若干个神经窗口全连接条件随机场模块,该训练方法包括将低分辨率图像输入所述图像超分辨率网络对其进行训练的训练步骤;创新性地将条件随机场的思想加入到图像超分辨率模型中,通过像素点与像素点间联系对特征进行约束,进行特征融合,通过混合注意力模块,其结合了移位窗口自注意力、空间注意力及通道注意力,利用它们的互补优势,克服了移位窗口机制因输入像素少,对网络性能提升产生的限制,保留了较强的局部特征表征能力。

    一种基于深度学习的二维超声图像的三维重建方法

    公开(公告)号:CN116310032A

    公开(公告)日:2023-06-23

    申请号:CN202310281244.0

    申请日:2023-03-20

    Abstract: 本发明属于医学图像处理技术领域,特别涉及一种基于深度学习的二维超声图像的三维重建方法。本发明提供一种新的基于深度学习的二维超声图像的三维重建方法,该方法将构建的高帧率的二维超声图像序列作为3DCNN‑LSTM网络的输入数据,再使用3DCNN进行B超图像帧间特征提取得到空间位姿信息,使用LSTM对空间位姿信息序列进行统计和预测,有效利用超声图像的帧间特征以及位姿信息序列的时空关联性,消除累积误差,提高三维重建的准确率。

    一种基于声光定位系统的三维超声重建探头

    公开(公告)号:CN116299494A

    公开(公告)日:2023-06-23

    申请号:CN202310271489.5

    申请日:2023-03-20

    Abstract: 本发明提出一种基于声光定位系统的三维超声重建探头,包括嵌入式上位机、超声成像模块和声光定位系统、定位手柄;超声成像模块用于获取二维超声图像序列,声光定位系统用于获取每帧二维超声图像的位姿信息,嵌入式上位机设有用于显示三维超声图像的显示模块。基于声光定位系统的三维超声重建探头的声波不受遮挡,可以在某些特殊场合弥补光学传感器的不足,相比其他三维定位技术,该技术基本不受外界环境影响。

Patent Agency Ranking