-
公开(公告)号:CN117351533A
公开(公告)日:2024-01-05
申请号:CN202310421455.X
申请日:2023-04-19
Applicant: 南通大学
IPC: G06V40/16 , G06V10/42 , G06V10/774 , G06V10/80 , G06V10/56 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明属于计算机视觉技术领域,具体涉及一种基于注意力知识蒸馏的轻量级行人重识别方法。本发明包括以下步骤:步骤1、输入1张彩色图像至轻量级行人重识别特征提取网络;步骤2、利用ResNet50网络和维度交互注意力块,将步骤1中输入的图像生成富含信息的浅层特征和深层特征;步骤3、利用bottleneck,使前三层的特征对齐第四层的特征,获得对齐的浅层特征和深层特征;步骤4、利用深层特征对浅层特征进行注意力迁移知识蒸馏;步骤5、利用步骤3获得的对齐的深层特征对浅层特征进行解耦知识蒸馏;步骤6、若达到指定的训练轮数,则结束;否则继续完成训练,返回步骤1。本发明减少了模型的参数,从而大大提高了模型的运行速度。
-
公开(公告)号:CN117333744A
公开(公告)日:2024-01-02
申请号:CN202311224546.0
申请日:2023-09-21
Applicant: 南通大学
IPC: G06V10/80 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明提供了一种基于空间特征融合和原型嵌入的无偏场景图生成方法,属于人工智能和计算机视觉技术领域。解决了场景图生成方法预测关系的准确率不足的技术问题。其技术方案为:用基于原型的表示建模主客体实例及谓词,得到若干实例原型和谓词原型,融合主客体实例原型得到主客体联合特征;建模主客体实例之间的相对位置得到空间特征;融合主客体联合特征与空间特征形成关系表示,与谓词原型进行匹配,获得匹配损失;以匹配损失和距离损失共同度量关系预测与真实谓词类之间的误差。本发明的有益效果为:本发明同时兼顾类内紧凑和类间分离的无偏场景图生成框架和每个实例的相对位置信息,来提高场景图生成中关系预测的准确率。
-
公开(公告)号:CN118116063B
公开(公告)日:2025-04-11
申请号:CN202311660193.9
申请日:2023-12-06
Applicant: 南通大学
IPC: G06V40/18 , G06V10/82 , G06V10/80 , G06V10/44 , G06V10/52 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了基于多模态与Transformer注意力机制的高精度视线估计方法,包括眼部图像特征提取部分、面部图像特征提取部分、特征融合部分;针对眼部图像,通过膨胀卷积层进行卷积处理,并通过全连接层得到眼部特征。针对面部图像,采用预训练的VGG16网络作为基础,并结合空间注意力机制进一步增强对眼部的关注度,最终通过全连接层得到面部特征。在特征融合部分,采用的Transformer结构独立地增强多模态特征的内部表示。最后,通过融合注意力机制,根据多模态特征在视线估计中的重要性动态调整各特征,从而实现更为精准的视线估计。
-
公开(公告)号:CN117612201B
公开(公告)日:2024-05-28
申请号:CN202311371401.3
申请日:2023-10-20
Applicant: 南通大学
IPC: G06V40/10 , G06V10/82 , G06V10/74 , G06N3/0475 , G06N3/0464 , G06N3/094
Abstract: 本发明公开了一种基于特征压缩的单样本行人重识别方法,包括:首先将行人重识别的标准数据集中的已标签图片进行对抗性生成图片操作;然后,将生成的图片以及未标签图片放入单样本行人重识别网络中,获得距离矩阵,选取得分最高的一定数量的图片,并标注伪标签;其次,选取行人图像,进入网络训练,特别地,对图片进行特征压缩,联合损失函数,训练出性能良好的单样本识别网络;最后,完成对目标行人的识别。本发明提出基于特征压缩的单样本行人重识别方法,选择逐步地添加未标注图像到模型中,利用对抗性生成图像避免过拟合,并利用特征压缩减小图片带来的噪声影响,从而提高模型识别的准确率。
-
公开(公告)号:CN117115850A
公开(公告)日:2023-11-24
申请号:CN202310562808.8
申请日:2023-05-18
IPC: G06V40/10 , G06V10/46 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于离线蒸馏的轻量级行人重识别方法,在数据集中选取行人的若干张图像构建样本,基于残差网络和归一化的注意力机制,提取样本中图像的特征,通过全连接网络和损失函数,基于提取后的图像特征,训练教师网络,根据获得的教师网络,通过解耦知识蒸馏,协助训练出性能相近的学生网络,并应用该模型,对目标区域的行人进行重识别;本发明提出了基于离线蒸馏的轻量级行人重识别网络,在仅损失少量精度的前提下,极大地降低了网络模型的参数量,有效地提升了行人重识别的推理速度。
-
公开(公告)号:CN116824695A
公开(公告)日:2023-09-29
申请号:CN202310669202.4
申请日:2023-06-07
Applicant: 南通大学
Abstract: 本发明属于计算机视觉技术领域,具体涉及一种基于特征去噪的行人再识别非局部防御方法。本发明包括以下步骤:步骤1、输入P×K张彩色图像至行人再识别非局部防御网络;步骤2、通过对输入的图像进行通道级图像擦除处理;步骤3、利用Resnet50网络和基于非局部特征去噪块,捕获特征之间的相似性;步骤4、通过联合损失函数,训练出性能良好的防御网络;步骤5、利用步骤3获得的对齐的深层特征对浅层特征进行解耦知识蒸馏;步骤6、若达到指定的训练轮数,则结束;否则继续完成训练,返回步骤1。本发明在使用非局部防御方法NFD改进现有行人再识别模型的基础上,显著提高了模型在面对攻击时的识别准确率。
-
公开(公告)号:CN119360302A
公开(公告)日:2025-01-24
申请号:CN202411429748.3
申请日:2024-10-14
Applicant: 南通大学
IPC: G06V20/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06V10/766 , G06V10/44
Abstract: 本发明计算机视觉技术领域,具体涉及一种多模态分级渐进交互网络的人群计数方法。本发明提出了一种多模态分级渐进交互网络的人群计数方法,通过设计信息聚合模块,允许不同模态的数据在每个处理阶段进行交互和融合,确保了关键信息能够有效地传递至高层,同时分别对低级和高级特征进行融合,有助于保留重要的局部信息,从而增强的模型适应性和灵活性,提高人群计数精度。本发明采用了均方根误差RMSE和网格平均绝对误差GMAE作为衡量标准。经过实验指标的验证,提出的方法相比其他无人机计数方法取得了精度上的进步,证明了其在实际应用的鲁棒性和应用价值。
-
公开(公告)号:CN119360291A
公开(公告)日:2025-01-24
申请号:CN202411262357.7
申请日:2024-09-10
Applicant: 南通大学
Abstract: 本发明公开了一种基于语义引导多级融合的跨模态人群计数方法,旨在解决多模态人群计数方法准确率低,鲁棒性差的问题,方法主要由信息交互模块和语义引导融合模块组成,其中信息交互模块通过对每层提取特征提取相应权重系数进行更新来实现反馈机制,语义引导融合模块主要是将语义拓展模块提取的高级特征与相应级别的模态特征进行融合。本发明通过信息交互和语义引导融合两个模块实现每层提取特征的及时反馈,同时经由高级语义信息提升整体对人群场景的理解能力,从而生成高质量人群密度图,实现高精度的人群计数。
-
公开(公告)号:CN117854009B
公开(公告)日:2024-07-19
申请号:CN202410126064.X
申请日:2024-01-29
Applicant: 南通大学
Abstract: 本发明公开了一种交叉协作融合的轻量化跨模态人群计数方法,本发明主要针对现有人群计数方法存在模型庞大,推理速度很慢两个问题,设计一种改进的人群计数方法。将RGB图像和热成像两种模态的图像经过预处理输入模型,首先为五层权重共享编码器提取特征,然后由跨策略增强编码器重新分配通道注意力,通过交叉注意力重新加权特征反应,将输出的三、四、五层特征扩大其感受野,并对其进行跨尺度跨模态解码,最后将特征总和经过回归器回归密度图生成预测人数,通过不断缩小与实际人数之间的差距,以提高人群计数的精度。
-
公开(公告)号:CN116824695B
公开(公告)日:2024-07-19
申请号:CN202310669202.4
申请日:2023-06-07
Applicant: 南通大学
Abstract: 本发明属于计算机视觉技术领域,具体涉及一种基于特征去噪的行人再识别非局部防御方法。本发明包括以下步骤:步骤1、输入P×K张彩色图像至行人再识别非局部防御网络;步骤2、通过对输入的图像进行通道级图像擦除处理;步骤3、利用Resnet50网络和基于非局部特征去噪块,捕获特征之间的相似性;步骤4、通过联合损失函数,训练出性能良好的防御网络;步骤5、利用步骤3获得的对齐的深层特征对浅层特征进行解耦知识蒸馏;步骤6、若达到指定的训练轮数,则结束;否则继续完成训练,返回步骤1。本发明在使用非局部防御方法NFD改进现有行人再识别模型的基础上,显著提高了模型在面对攻击时的识别准确率。
-
-
-
-
-
-
-
-
-