低光环境下高精度的视线估计方法

    公开(公告)号:CN118799949A

    公开(公告)日:2024-10-18

    申请号:CN202410833622.6

    申请日:2024-06-26

    Applicant: 南通大学

    Abstract: 本发明公开了一种低光环境下高精度的视线估计方法,包括如下步骤:S1.数据集预处理,模拟低光环境S2.低光图像增加,得到增强后的图像;S3.增强图像校准,得到校准图像;S4.图像进行特征提取,输出特征向量;使用改进的残差网络模型ResNet18对校准后的图像进行特征提取;S5.通过全连接层将特征向量映射成三维输出向量;S6.对三维输出向量的前两个元素应用双曲正切变换,以获取精确的预测视线方向;S7.对三维输出向量的第三个元素通过sigmoid函数变换,得到视线预测的不确定性;S8.采用MSELoss损失函数来度量预测结果与真实值之间的误差。本发明方法能有效解决在低光环境下视线估计精度显著下降的问题,从而提高系统的实用性和准确性。

    一种基于空间特征融合和原型嵌入的无偏场景图生成方法

    公开(公告)号:CN117333744B

    公开(公告)日:2024-05-28

    申请号:CN202311224546.0

    申请日:2023-09-21

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于空间特征融合和原型嵌入的无偏场景图生成方法,属于人工智能和计算机视觉技术领域。解决了场景图生成方法预测关系的准确率不足的技术问题。其技术方案为:用基于原型的表示建模主客体实例及谓词,得到若干实例原型和谓词原型,融合主客体实例原型得到主客体联合特征;建模主客体实例之间的相对位置得到空间特征;融合主客体联合特征与空间特征形成关系表示,与谓词原型进行匹配,获得匹配损失;以匹配损失和距离损失共同度量关系预测与真实谓词类之间的误差。本发明的有益效果为:本发明同时兼顾类内紧凑和类间分离的无偏场景图生成框架和每个实例的相对位置信息,来提高场景图生成中关系预测的准确率。

    一种基于局部超分辨率融合注意力机制的视线估计方法

    公开(公告)号:CN117830783A

    公开(公告)日:2024-04-05

    申请号:CN202410005814.8

    申请日:2024-01-03

    Applicant: 南通大学

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于局部超分辨率融合注意力机制的视线估计方法。包括如下步骤:步骤S1、使用摄像头获取帧图像;步骤S2、采用人脸检测模型对人脸区域和双眼区域进行检测和定位,将人脸图像进行裁剪,并截取眼部图像;步骤S3、将人脸图像通过人脸注意力强化特征提取模块,强化并提取人脸图像特征;步骤S4、将双眼图像通过基于局部超分辨率的眼部特征提取模块,提取双眼图像特征;步骤S5、通过全连接层融合提取的人脸图像和双眼图像特征得到视线估计结果。本发明提取超分辨率后的眼部特征,进行准确地视线估计,从空间和通道两个方向增强低分辨率全局特征,以增加低分辨率环境下提取人脸特征的能力,提升视线估计的效果。

    低光环境下高精度的视线估计方法

    公开(公告)号:CN118799949B

    公开(公告)日:2025-04-11

    申请号:CN202410833622.6

    申请日:2024-06-26

    Applicant: 南通大学

    Abstract: 本发明公开了一种低光环境下高精度的视线估计方法,包括如下步骤:S1.数据集预处理,模拟低光环境S2.低光图像增加,得到增强后的图像;S3.增强图像校准,得到校准图像;S4.图像进行特征提取,输出特征向量;使用改进的残差网络模型ResNet18对校准后的图像进行特征提取;S5.通过全连接层将特征向量映射成三维输出向量;S6.对三维输出向量的前两个元素应用双曲正切变换,以获取精确的预测视线方向;S7.对三维输出向量的第三个元素通过sigmoid函数变换,得到视线预测的不确定性;S8.采用MSELoss损失函数来度量预测结果与真实值之间的误差。本发明方法能有效解决在低光环境下视线估计精度显著下降的问题,从而提高系统的实用性和准确性。

    一种基于局部超分辨率融合注意力机制的视线估计方法

    公开(公告)号:CN117830783B

    公开(公告)日:2024-09-03

    申请号:CN202410005814.8

    申请日:2024-01-03

    Applicant: 南通大学

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于局部超分辨率融合注意力机制的视线估计方法。包括如下步骤:步骤S1、使用摄像头获取帧图像;步骤S2、采用人脸检测模型对人脸区域和双眼区域进行检测和定位,将人脸图像进行裁剪,并截取眼部图像;步骤S3、将人脸图像通过人脸注意力强化特征提取模块,强化并提取人脸图像特征;步骤S4、将双眼图像通过基于局部超分辨率的眼部特征提取模块,提取双眼图像特征;步骤S5、通过全连接层融合提取的人脸图像和双眼图像特征得到视线估计结果。本发明提取超分辨率后的眼部特征,进行准确地视线估计,从空间和通道两个方向增强低分辨率全局特征,以增加低分辨率环境下提取人脸特征的能力,提升视线估计的效果。

    一种基于渐进采样的层级式图像分类方法

    公开(公告)号:CN116797835A

    公开(公告)日:2023-09-22

    申请号:CN202310758952.9

    申请日:2023-06-26

    Applicant: 南通大学

    Abstract: 本发明属于计算机视觉技术领域,具体涉及一种基于渐进采样的层级式图像分类方法。包括以下步骤:S1:将图片送入第一个阶段的分层模块中,利用特征金字塔的结构将图片的分辨率由低到高依次输出不同的特征图,分别作为阶段1,阶段2,阶段3,阶段4的特征图;S2:将各层的特征图分别送入到对应阶段中的渐进采样模块中,对判别位置进行定位;S3:将采样步长的嵌入馈送到Transformer编码层,预测下一组采样偏移,更新下一组的采样位置;S4:重复进行S2和S3,从最后一次迭代中得到最后的输出令牌;S5:将不同层的特征图分别通过分类器单元将最终的输出向量转化成概率表示,完成各层的图像分类;S6:利用最大值法,结合最后的分类结果,得出最后的图像分类。

    一种基于特征压缩的单样本行人重识别方法

    公开(公告)号:CN117612201A

    公开(公告)日:2024-02-27

    申请号:CN202311371401.3

    申请日:2023-10-20

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于特征压缩的单样本行人重识别方法,包括:首先将行人重识别的标准数据集中的已标签图片进行对抗性生成图片操作;然后,将生成的图片以及未标签图片放入单样本行人重识别网络中,获得距离矩阵,选取得分最高的一定数量的图片,并标注伪标签;其次,选取行人图像,进入网络训练,特别地,对图片进行特征压缩,联合损失函数,训练出性能良好的单样本识别网络;最后,完成对目标行人的识别。本发明提出基于特征压缩的单样本行人重识别方法,选择逐步地添加未标注图像到模型中,利用对抗性生成图像避免过拟合,并利用特征压缩减小图片带来的噪声影响,从而提高模型识别的准确率。

Patent Agency Ranking