-
公开(公告)号:CN116434025A
公开(公告)日:2023-07-14
申请号:CN202310438180.0
申请日:2023-04-23
Applicant: 南通大学
Abstract: 本发明涉及目标检测技术领域,具体涉及一种基于多尺度感受野特征融合的目标检测模型,本发明设计新模块CspRepSPP,使用深度卷积(Depthwise Convolution)代替SPPF模块中的最大池化,通过深度卷积在特征图每个通道上进行卷积运算,有效地解决了原模块存在的信息丢失问题,并通过结构重参数化与CSP(CrossStagePartial)化进一步降低了模块在推理过程中的计算量。新模块CspRepSPP相比SPPF,在推理阶段具有更快的运算速度,并有更大的精度提升。同时,本发明受SPP的多尺度感受野特征融合思想启发,设计了一个新的特征提取模块ImprovedBottleNeck,将该模块替换YOLOv5中的传统BottleNeck,使得目标检测模型在每个阶段都对不同大小感受野的特征进行融合,进一步提升了模型的检测精度,并且没有额外的运算量。
-
公开(公告)号:CN115984965A
公开(公告)日:2023-04-18
申请号:CN202211734556.4
申请日:2022-12-31
Applicant: 南通大学 , 南京联云智能系统有限公司
IPC: G06V40/20 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种3D人体姿态估计方法,该方法包括坐标Transformer编码器和时域Transformer编码器两个组件,分别从空间和时间的角度增强网络提取特征的能力。首先利用坐标Transformer编码器将输入的2D人体姿态序列生成多个可行解,并利用多层感知机实现多个可行解之间的信息交换;然后通过多对一的映射生成一个更加可靠的可行解;再利用时域Transformer编码器捕获输入序列的全局依赖关系,最后通过一个回归首部输出3D人体姿态坐标。本发明的优点在于,使网络预测更加准确,同时避免了传统的膨胀时序卷积方法时间窗受限的问题。
-
公开(公告)号:CN115984841A
公开(公告)日:2023-04-18
申请号:CN202310035306.X
申请日:2023-01-10
Applicant: 南通大学
IPC: G06V20/62 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种准确的车牌识别方法,涉及智能交通技术领域。为了解决车牌样本数量不够的问题,本申请首先采用图像处理的方法合成标准的汽车车牌图像,接着使用生成对抗网络技术由标准车牌生成逼真的虚拟车牌,实现车牌数据集的增强,然后利用增强的车牌数据集,训练一个无需字符分割的端到端的全卷积车牌识别网络,最后基于输入的新车牌图像和训练好的车牌识别网络直接输出车牌号码。本发明的车牌识别方法鲁棒性强,识别准确率高,并使用车牌生成网络产生虚拟车牌数据集,解决了车牌数据集样本不足和样本不均问题,实现了车牌的准确识别。
-
公开(公告)号:CN117456161B
公开(公告)日:2025-01-14
申请号:CN202311395550.3
申请日:2023-10-26
Applicant: 南通大学
IPC: G06V10/25 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本申请公开了一种半监督目标检测方法,首先,在数据集上添加多尺度缩放数据增强;接着,针对两阶段目标检测模型FasterR‑CNN的区域候选网络RPN和区域预测头RoIHead,分别提出了一个多尺度正则化损失函数,使得模型对图像以及对应最大池化下采样图像输出相同的预测结果,提高模型鲁棒性。为解决半监督目标检测算法忽略无标签数据的定位损失计算问题,本申请提出了再预测算法,用来衡量伪标签的定位质量,同时将定位准确的可靠分类伪标签用于无标签数据的定位损失的计算,提高模型的定位精度。
-
公开(公告)号:CN115497162A
公开(公告)日:2022-12-20
申请号:CN202211149451.2
申请日:2022-09-21
Applicant: 南通大学
Abstract: 本发明公开了一种基于单目视觉的3D人体姿态检测方法,包括:1、使用YOLOX模型检测输入图像中存在的人,并获得相应的人物检测框;2、基于YOLOX检测出的人物检测框计算检测框中心点坐标,然后放大检测出的人物,从而获得新的人物图像;3、在获得的新人物图像中提取2D人体关节点坐标序列;4、构建回归映射神经网络将2D人体关节点坐标序列转换为3D人体关节点坐标序列;5、在Human3.6M公开数据集上训练上述回归映射神经网络;6、测试回归映射神经网络,检测3D人体姿态。本方法利用回归的方法检测人体姿态,解决了原有方法中出现的漏检情况。
-
公开(公告)号:CN115810185A
公开(公告)日:2023-03-17
申请号:CN202211653367.4
申请日:2022-12-21
Applicant: 南通大学
IPC: G06V20/62 , G06V30/19 , G06V30/16 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/094 , G06N3/082
Abstract: 本发明提供基于生成对抗网络数据增强的轻量级车牌识别方法,涉及智能交通技术领域,本申请提出了一个无需字符分割的端到端的轻量级全卷积车牌识别网络LPRNeXt,输入车牌图像后可以直接输出车牌号码。该网络鲁棒性强,识别准确率高,处理速度快,并使用车牌生成网络进行数据增强,生成的虚拟车牌数据集,解决了车牌数据集CCPD2019中存在的样本不均问题,进一步提高了车牌识别准确率。
-
公开(公告)号:CN117456167A
公开(公告)日:2024-01-26
申请号:CN202311436139.6
申请日:2023-11-01
Applicant: 南通大学
IPC: G06V10/25 , G06V10/82 , G06V10/20 , G06V10/44 , G06V10/764 , G06V10/766 , G06V10/77 , G06V10/54 , G06V10/771 , G06N3/0464 , G06N3/0442 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于改进YOLOv8s的目标检测算法,在VOC2012数据集上重新训练模型,网络的主体部分包括输入、数据预处理、Backbone、Neck和输出。本发明增强了模型中的梯度流信息,更好的提取不同尺寸之间的空间特征信息,既可以捕捉到图像中的边缘、纹理等特征,也保留了图像中最显著的特征,更多地学习到多尺度、多层次的特征表示,使模型自适应地调整不同位置的特征权重,更加关注目标区域并减少背景干扰,提高目标精确定位的能力,优化梯度在反向传播过程中的流动,减少梯度消失现象,加快收敛速度,更充分的利用上下文信息,提高模型对于目标的检测和识别能力。
-
公开(公告)号:CN117456161A
公开(公告)日:2024-01-26
申请号:CN202311395550.3
申请日:2023-10-26
Applicant: 南通大学
IPC: G06V10/25 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本申请公开了一种半监督目标检测方法,首先,在数据集上添加多尺度缩放数据增强;接着,针对两阶段目标检测模型FasterR‑CNN的区域候选网络RPN和区域预测头RoIHead,分别提出了一个多尺度正则化损失函数,使得模型对图像以及对应最大池化下采样图像输出相同的预测结果,提高模型鲁棒性。为解决半监督目标检测算法忽略无标签数据的定位损失计算问题,本申请提出了再预测算法,用来衡量伪标签的定位质量,同时将定位准确的可靠分类伪标签用于无标签数据的定位损失的计算,提高模型的定位精度。
-
公开(公告)号:CN116935325A
公开(公告)日:2023-10-24
申请号:CN202310991297.1
申请日:2023-08-08
Applicant: 南通大学
IPC: G06V20/52 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T7/246
Abstract: 本发明提供一种基于检测和跟踪的公交站台遗留物检测方法,包括以下步骤:构建图像数据集;将图像数据集输入到改进后的YOLOv5s目标检测器中进行训练;用训练好的YOLOv5s目标检测器识别乘客及其随身携带的物品;通过多目标跟踪器StrongSORT对目标的运动轨迹进行跟踪;利用欧几里得距离度量和速度度量对多个物品及其对应乘客进行匹配;根据乘客、物品的匹配关系和遗留判定规则,判断视频帧中出现的物品是否为遗留物,并向控制台发送预警信息。本发明可以克服光影变化和场景变化,有效过滤环境噪声的干扰。通过新型空间金字塔池化层和特征提取模块,结合新型多目标跟踪器StrongSORT,本发明的检测效果更优,即使在复杂、有遮挡的环境中,也能准确的检测出遗留物。
-
-
-
-
-
-
-
-