一种基于多尺度感受野特征融合的目标检测模型

    公开(公告)号:CN116434025A

    公开(公告)日:2023-07-14

    申请号:CN202310438180.0

    申请日:2023-04-23

    Applicant: 南通大学

    Abstract: 本发明涉及目标检测技术领域,具体涉及一种基于多尺度感受野特征融合的目标检测模型,本发明设计新模块CspRepSPP,使用深度卷积(Depthwise Convolution)代替SPPF模块中的最大池化,通过深度卷积在特征图每个通道上进行卷积运算,有效地解决了原模块存在的信息丢失问题,并通过结构重参数化与CSP(CrossStagePartial)化进一步降低了模块在推理过程中的计算量。新模块CspRepSPP相比SPPF,在推理阶段具有更快的运算速度,并有更大的精度提升。同时,本发明受SPP的多尺度感受野特征融合思想启发,设计了一个新的特征提取模块ImprovedBottleNeck,将该模块替换YOLOv5中的传统BottleNeck,使得目标检测模型在每个阶段都对不同大小感受野的特征进行融合,进一步提升了模型的检测精度,并且没有额外的运算量。

    一种3D人体姿态估计方法
    2.
    发明公开

    公开(公告)号:CN115984965A

    公开(公告)日:2023-04-18

    申请号:CN202211734556.4

    申请日:2022-12-31

    Abstract: 本发明公开了一种3D人体姿态估计方法,该方法包括坐标Transformer编码器和时域Transformer编码器两个组件,分别从空间和时间的角度增强网络提取特征的能力。首先利用坐标Transformer编码器将输入的2D人体姿态序列生成多个可行解,并利用多层感知机实现多个可行解之间的信息交换;然后通过多对一的映射生成一个更加可靠的可行解;再利用时域Transformer编码器捕获输入序列的全局依赖关系,最后通过一个回归首部输出3D人体姿态坐标。本发明的优点在于,使网络预测更加准确,同时避免了传统的膨胀时序卷积方法时间窗受限的问题。

    一种准确的车牌识别方法
    3.
    发明公开

    公开(公告)号:CN115984841A

    公开(公告)日:2023-04-18

    申请号:CN202310035306.X

    申请日:2023-01-10

    Applicant: 南通大学

    Abstract: 本发明提供一种准确的车牌识别方法,涉及智能交通技术领域。为了解决车牌样本数量不够的问题,本申请首先采用图像处理的方法合成标准的汽车车牌图像,接着使用生成对抗网络技术由标准车牌生成逼真的虚拟车牌,实现车牌数据集的增强,然后利用增强的车牌数据集,训练一个无需字符分割的端到端的全卷积车牌识别网络,最后基于输入的新车牌图像和训练好的车牌识别网络直接输出车牌号码。本发明的车牌识别方法鲁棒性强,识别准确率高,并使用车牌生成网络产生虚拟车牌数据集,解决了车牌数据集样本不足和样本不均问题,实现了车牌的准确识别。

    一种半监督目标检测方法

    公开(公告)号:CN117456161B

    公开(公告)日:2025-01-14

    申请号:CN202311395550.3

    申请日:2023-10-26

    Applicant: 南通大学

    Abstract: 本申请公开了一种半监督目标检测方法,首先,在数据集上添加多尺度缩放数据增强;接着,针对两阶段目标检测模型FasterR‑CNN的区域候选网络RPN和区域预测头RoIHead,分别提出了一个多尺度正则化损失函数,使得模型对图像以及对应最大池化下采样图像输出相同的预测结果,提高模型鲁棒性。为解决半监督目标检测算法忽略无标签数据的定位损失计算问题,本申请提出了再预测算法,用来衡量伪标签的定位质量,同时将定位准确的可靠分类伪标签用于无标签数据的定位损失的计算,提高模型的定位精度。

    一种基于单目视觉的3D人体姿态检测方法

    公开(公告)号:CN115497162A

    公开(公告)日:2022-12-20

    申请号:CN202211149451.2

    申请日:2022-09-21

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于单目视觉的3D人体姿态检测方法,包括:1、使用YOLOX模型检测输入图像中存在的人,并获得相应的人物检测框;2、基于YOLOX检测出的人物检测框计算检测框中心点坐标,然后放大检测出的人物,从而获得新的人物图像;3、在获得的新人物图像中提取2D人体关节点坐标序列;4、构建回归映射神经网络将2D人体关节点坐标序列转换为3D人体关节点坐标序列;5、在Human3.6M公开数据集上训练上述回归映射神经网络;6、测试回归映射神经网络,检测3D人体姿态。本方法利用回归的方法检测人体姿态,解决了原有方法中出现的漏检情况。

    一种半监督目标检测方法

    公开(公告)号:CN117456161A

    公开(公告)日:2024-01-26

    申请号:CN202311395550.3

    申请日:2023-10-26

    Applicant: 南通大学

    Abstract: 本申请公开了一种半监督目标检测方法,首先,在数据集上添加多尺度缩放数据增强;接着,针对两阶段目标检测模型FasterR‑CNN的区域候选网络RPN和区域预测头RoIHead,分别提出了一个多尺度正则化损失函数,使得模型对图像以及对应最大池化下采样图像输出相同的预测结果,提高模型鲁棒性。为解决半监督目标检测算法忽略无标签数据的定位损失计算问题,本申请提出了再预测算法,用来衡量伪标签的定位质量,同时将定位准确的可靠分类伪标签用于无标签数据的定位损失的计算,提高模型的定位精度。

    一种基于检测和跟踪的公交站台遗留物检测方法

    公开(公告)号:CN116935325A

    公开(公告)日:2023-10-24

    申请号:CN202310991297.1

    申请日:2023-08-08

    Applicant: 南通大学

    Abstract: 本发明提供一种基于检测和跟踪的公交站台遗留物检测方法,包括以下步骤:构建图像数据集;将图像数据集输入到改进后的YOLOv5s目标检测器中进行训练;用训练好的YOLOv5s目标检测器识别乘客及其随身携带的物品;通过多目标跟踪器StrongSORT对目标的运动轨迹进行跟踪;利用欧几里得距离度量和速度度量对多个物品及其对应乘客进行匹配;根据乘客、物品的匹配关系和遗留判定规则,判断视频帧中出现的物品是否为遗留物,并向控制台发送预警信息。本发明可以克服光影变化和场景变化,有效过滤环境噪声的干扰。通过新型空间金字塔池化层和特征提取模块,结合新型多目标跟踪器StrongSORT,本发明的检测效果更优,即使在复杂、有遮挡的环境中,也能准确的检测出遗留物。

Patent Agency Ranking