-
公开(公告)号:CN119992053A
公开(公告)日:2025-05-13
申请号:CN202510075140.3
申请日:2025-01-17
Applicant: 南京邮电大学
IPC: G06V10/25 , G06V10/82 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/80 , G06V20/58 , G06N3/045 , G06N3/0464 , G06N3/0495 , G06N3/096
Abstract: 本发明公开了一种基于瓶颈设计和双线蒸馏的高效目标检测方法及系统,首先构建基于轻量级瓶颈设计和双线蒸馏模块的高效目标检测神经网络;所述高效目标检测神经网络包括利用轻量级瓶颈构建的高效目标检测神经网络、特征蒸馏模块与逻辑蒸馏模块按比例混合的双线蒸馏模块,所述利用轻量级瓶颈构建的高雄啊目标检测神经网络包括教师网络和学生网络,所述学生网络的蒸馏权重利用教师网络的训练权重通过双线蒸馏模块对学生网络进行离线蒸馏得到;将待检测目标图像输入学生网络进行识别,获得检测信息。本发明能够在保持网络检测精度的同时降低网络计算复杂度、加快网络推理速度。
-
公开(公告)号:CN117409268A
公开(公告)日:2024-01-16
申请号:CN202311290732.4
申请日:2023-10-08
Applicant: 南京邮电大学
IPC: G06V10/774 , G06V10/80 , G06V10/764 , G06V10/56 , G06V10/54 , G06V10/82 , G06V10/44 , G06N3/096 , G06N3/0464
Abstract: 本发明公开了一种基于互注意力融合和蒸馏机制的场景识别方法和系统,适用于多模态场景,包括以下步骤:使用卷积神经网络对多模态场景数据集进行训练;将RGB图像和HHA图像进行序列化并添加位置编码,以得到RGB数据、HHA数据以及早期融合数据;构建端到端可训练的神经网络模型SAD,其中,SAD包括场景特征提取网络FEN、互补性特征融合模块CFB以及蒸馏模块;将未序列化的多模态场景数据集作为蒸馏模块输入,将此前得到的三种数据作为FEN输入,之后再通过CFB模块,并使用蒸馏模块指导整个网络的训练;图像经过序列化后得到相应数据,经过FEN提取多模态场景的特征后,再输入CFB模块得到该图像的场景类别。本发明的方法和系统提高了多模态场景识别的准确率。
-
公开(公告)号:CN116229147A
公开(公告)日:2023-06-06
申请号:CN202310003314.6
申请日:2023-01-03
Applicant: 南京邮电大学
IPC: G06V10/764 , G06V10/82 , G06N3/08
Abstract: 本发明提出了一种基于几何损失函数的轻量化目标检测方法和系统。该方法包括以下步骤:1、从图像识别的数据集中选取多张图片,通过使用标注工具对图像中的物体进行标注并对每张图像进行裁剪操作,将裁剪过后的图像按相应的比例划分为训练集和测试集;2、构建了一种基于几何损失函数的轻量化目标检测器;3、将步骤1中划分好的训练集送入到基于几何损失函数的轻量化目标检测器中进行训练;4、保存训练得到模型,用于之后的目标检测,最终得到图像里面对应目标的类别和位置信息。本发明将图像送入轻量化目标检测器进行训练后,用保存下了的训练模型进行检测,可以达到良好检测效果的同时提高检测速度,并且更适合实际场景的应用。
-
-