-
公开(公告)号:CN119649353A
公开(公告)日:2025-03-18
申请号:CN202411817568.2
申请日:2024-12-11
Applicant: 南通大学
IPC: G06V20/60 , G06V10/774 , G06V10/82 , G06V10/25 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开了一种结合Real‑Time Detection transformer(RT‑DETR)与状态空间的道路垃圾检测方法,包括以下步骤:首先通过爬虫获取图像并进行标注,构建了一个多样化城市道路场景的垃圾检测数据集;接着设计了一种全新的特征金字塔结构(FFS)和基于状态空间的内尺度特征强化模块(IFEM),建立了一个结合RT‑DETR与状态空间的道路垃圾检测模型。最后使用自建的道路垃圾数据集训练模型,并在COCO2017数据集上进行实验,实验证明本发明所提出的算法在实时性与准确性之间取得了良好的平衡,显著提升了模型在复杂环境中的表现,特别是在小目标识别和遮挡情况下的检测精度。
-
公开(公告)号:CN119693970A
公开(公告)日:2025-03-25
申请号:CN202411757032.6
申请日:2024-12-03
Applicant: 南通大学
IPC: G06V40/10 , G06V10/774 , G06V10/40 , G06V10/84 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于级联通道注意力的暗光多人姿态估计方法。首先,获取图像构建数据集,然后构建网络模型:基于高分辨率网络,在编码阶段,采用一种引入级联通道注意力机制的人体姿态估计方法;在解码阶段,改进传统热图方法,采用分类思想将每个像素均匀划分为多个区间,生成最终的姿态估计结果。最后对网络模型进行训练,并在暗光多人场景中进行姿态估计。本发明在保持内部高分辨率特征的同时,使模型能够学习输入特征各通道的重要性,从而增强其表征能力,有效减少信息丢失。该方法提高了准确度,并且在暗光场景下也能实现较为精确的人体姿态估计,满足实际应用中的适应性要求,具备更强的泛化能力,能够适应更广泛的应用场景。
-
公开(公告)号:CN119904892A
公开(公告)日:2025-04-29
申请号:CN202411957593.0
申请日:2024-12-30
Applicant: 南通大学
Abstract: 本申请公开了一种基于多注意力机制HRNet的拥挤多人姿态估计方法,包括以下步骤:采集人体图片并转化成标准数据集格式,得到第一数据集;基于HRNet(High ResolutionNet)模型加入多注意力机制模块,构建改进HRNet模型;基于第一数据集,训练改进HRNet模型;使用训练好的改进HRNet模型对拥挤多人场景进行测试。本申请的通道注意力瓶颈模块通过利用通道之间特征关系的相互依赖,增强了特征的表示能力,使模型能够更加关注主要特征,提升了局部信息的交换能力。而交叉注意力模块则对通道维度关系和远程依赖性进行编码,捕捉方向感知和位置敏感信息,从而增强了全局特征信息的关联性。
-
公开(公告)号:CN118968255A
公开(公告)日:2024-11-15
申请号:CN202411159169.1
申请日:2024-08-22
Applicant: 南通大学
IPC: G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明实现了一种基于混合扫描Vision Mamba模型的道路垃圾检测方法。包括以下步骤:构建道路垃圾检测数据集;图像标记和数据增强;构建基于混合扫描的改进Vision Mamba模型;训练基于混合扫描的改进Vision Mamba模型;使用训练好的改进Vision Mamba模型检测道路垃圾,并在cifar‑100数据集上进行实验。实验证明改进后的模型有效缓解了Vision Mamba模型空间上下文的有限捕获与不对称的信息处理的问题,其中的Hilbert与分块的patch tokens扫描方式提升了模型对小目标检测的准确度。
-
-
-