-
公开(公告)号:CN117744714B
公开(公告)日:2025-01-03
申请号:CN202311835225.4
申请日:2023-12-28
Applicant: 南通大学
IPC: G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于回调的深度神经网络错误定位方法,分为模型准备、错误检测、统计分析三个步骤。在模型准备阶段,选择合理的DNN模型以满足问题需求。错误检测阶段持续跟踪关键参数,通过回调机制监控训练损失、验证损失、训练准确率和验证准确率等参数。统计分析阶段运用滑动平均、变化率计算、阈值判定和可视化分析等方法,准确定位模型中的错误,提高深度学习模型的诊断精度和全面性。针对DNN模型中的欠拟合和过拟合问题进行错误定位,实现了对深度学习模型训练问题的实时诊断与定位,提高了定位的全面性和精确性,为深度学习模型的错误诊断提供更加全面的支持。
-
公开(公告)号:CN117830783B
公开(公告)日:2024-09-03
申请号:CN202410005814.8
申请日:2024-01-03
Applicant: 南通大学
IPC: G06V10/80 , G06T3/4053 , G06V40/16 , G06T3/4007 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于局部超分辨率融合注意力机制的视线估计方法。包括如下步骤:步骤S1、使用摄像头获取帧图像;步骤S2、采用人脸检测模型对人脸区域和双眼区域进行检测和定位,将人脸图像进行裁剪,并截取眼部图像;步骤S3、将人脸图像通过人脸注意力强化特征提取模块,强化并提取人脸图像特征;步骤S4、将双眼图像通过基于局部超分辨率的眼部特征提取模块,提取双眼图像特征;步骤S5、通过全连接层融合提取的人脸图像和双眼图像特征得到视线估计结果。本发明提取超分辨率后的眼部特征,进行准确地视线估计,从空间和通道两个方向增强低分辨率全局特征,以增加低分辨率环境下提取人脸特征的能力,提升视线估计的效果。
-
公开(公告)号:CN116682058A
公开(公告)日:2023-09-01
申请号:CN202310622359.1
申请日:2023-05-30
Applicant: 南通大学
IPC: G06V20/52 , G06V10/26 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/766 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于空间池化的轻量级ViT弱监督人群计数方法,属于深度学习和计算机视觉技术领域,具体包括以下步骤:首先,对输入的人群图像进行预处理和伪彩色处理,增强图像的对比度和细节信息;然后,使用PoolFormer作为主干网络,提取图像的特征表示,PoolFormer利用全局池化替代自注意力机制,有效降低了模型参数和计算复杂度;最后,使用深度回归器对特征进行人群数量的回归,深度回归器增强了模型的非线性表达能力。本发明相比现有的基于ViT的弱监督人群计数方法,在保证高准确率的同时,提升了计算效率和模型大小,并且具有更好的泛化能力。
-
公开(公告)号:CN117830783A
公开(公告)日:2024-04-05
申请号:CN202410005814.8
申请日:2024-01-03
Applicant: 南通大学
IPC: G06V10/80 , G06T3/4053 , G06V40/16 , G06T3/4007 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于局部超分辨率融合注意力机制的视线估计方法。包括如下步骤:步骤S1、使用摄像头获取帧图像;步骤S2、采用人脸检测模型对人脸区域和双眼区域进行检测和定位,将人脸图像进行裁剪,并截取眼部图像;步骤S3、将人脸图像通过人脸注意力强化特征提取模块,强化并提取人脸图像特征;步骤S4、将双眼图像通过基于局部超分辨率的眼部特征提取模块,提取双眼图像特征;步骤S5、通过全连接层融合提取的人脸图像和双眼图像特征得到视线估计结果。本发明提取超分辨率后的眼部特征,进行准确地视线估计,从空间和通道两个方向增强低分辨率全局特征,以增加低分辨率环境下提取人脸特征的能力,提升视线估计的效果。
-
公开(公告)号:CN117456449A
公开(公告)日:2024-01-26
申请号:CN202311331334.2
申请日:2023-10-13
Applicant: 南通大学
IPC: G06V20/52 , G06V10/44 , G06V10/46 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明提供了一种基于特定信息的高效跨模态人群计数方法,属于深度学习和计算机视觉技术领域。解决了低照度环境下人群计数精度不高,误差较大的技术问题。其技术方案为:使用热红外图像作为RGB图像信息的补充,通过探索模态共享信息和特定信息的表达,充分结合两种模态的互补特征和各自的特有特征,有效提高在低照度环境下人群计数的精度。本发明的有益效果为:本发明的方法用于学习和融合两种模态特征的表示,以增强对光照不足问题的鲁棒性,从而提高人群计数的准确率。
-
公开(公告)号:CN118762324A
公开(公告)日:2024-10-11
申请号:CN202410899839.7
申请日:2024-07-05
Applicant: 南通大学
IPC: G06V20/52 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于模态注意力门控循环单元的多模态人群计数方法,所述方法包括:对人群数据进行预处理;将预处理后的数据输入Res2Net主干网络提取特征输出;将提取的第五层特征输入特定特征融合模块提取隐藏状态;将提取的五层特征和隐藏状态基于多层门控循环单元进行特征融合;将融合的特征输入细节记忆增强模块,得到估计人群密度图。本发明提高准确率的同时,提高了模型在低光照下的鲁棒性。
-
公开(公告)号:CN116682058B
公开(公告)日:2024-07-30
申请号:CN202310622359.1
申请日:2023-05-30
Applicant: 南通大学
IPC: G06V20/52 , G06V10/26 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/766 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于空间池化的轻量级ViT弱监督人群计数方法,属于深度学习和计算机视觉技术领域,具体包括以下步骤:首先,对输入的人群图像进行预处理和伪彩色处理,增强图像的对比度和细节信息;然后,使用PoolFormer作为主干网络,提取图像的特征表示,PoolFormer利用全局池化替代自注意力机制,有效降低了模型参数和计算复杂度;最后,使用深度回归器对特征进行人群数量的回归,深度回归器增强了模型的非线性表达能力。本发明相比现有的基于ViT的弱监督人群计数方法,在保证高准确率的同时,提升了计算效率和模型大小,并且具有更好的泛化能力。
-
公开(公告)号:CN117854009B
公开(公告)日:2024-07-19
申请号:CN202410126064.X
申请日:2024-01-29
Applicant: 南通大学
Abstract: 本发明公开了一种交叉协作融合的轻量化跨模态人群计数方法,本发明主要针对现有人群计数方法存在模型庞大,推理速度很慢两个问题,设计一种改进的人群计数方法。将RGB图像和热成像两种模态的图像经过预处理输入模型,首先为五层权重共享编码器提取特征,然后由跨策略增强编码器重新分配通道注意力,通过交叉注意力重新加权特征反应,将输出的三、四、五层特征扩大其感受野,并对其进行跨尺度跨模态解码,最后将特征总和经过回归器回归密度图生成预测人数,通过不断缩小与实际人数之间的差距,以提高人群计数的精度。
-
公开(公告)号:CN117456449B
公开(公告)日:2024-06-25
申请号:CN202311331334.2
申请日:2023-10-13
Applicant: 南通大学
IPC: G06V20/52 , G06V10/44 , G06V10/46 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明提供了一种基于特定信息的高效跨模态人群计数方法,属于深度学习和计算机视觉技术领域。解决了低照度环境下人群计数精度不高,误差较大的技术问题。其技术方案为:使用热红外图像作为RGB图像信息的补充,通过探索模态共享信息和特定信息的表达,充分结合两种模态的互补特征和各自的特有特征,有效提高在低照度环境下人群计数的精度。本发明的有益效果为:本发明的方法用于学习和融合两种模态特征的表示,以增强对光照不足问题的鲁棒性,从而提高人群计数的准确率。
-
公开(公告)号:CN117854009A
公开(公告)日:2024-04-09
申请号:CN202410126064.X
申请日:2024-01-29
Applicant: 南通大学
Abstract: 本发明公开了一种交叉协作融合的轻量化跨模态人群计数方法,本发明主要针对现有人群计数方法存在模型庞大,推理速度很慢两个问题,设计一种改进的人群计数方法。将RGB图像和热成像两种模态的图像经过预处理输入模型,首先为五层权重共享编码器提取特征,然后由跨策略增强编码器重新分配通道注意力,通过交叉注意力重新加权特征反应,将输出的三、四、五层特征扩大其感受野,并对其进行跨尺度跨模态解码,最后将特征总和经过回归器回归密度图生成预测人数,通过不断缩小与实际人数之间的差距,以提高人群计数的精度。
-
-
-
-
-
-
-
-
-