一种多模态网约车舒适度评价网络模型及其构建方法

    公开(公告)号:CN119227510A

    公开(公告)日:2024-12-31

    申请号:CN202411218664.5

    申请日:2024-09-02

    Applicant: 南通大学

    Abstract: 本发明提供一种遗传算法优化的多模态网约车舒适度评价网络模型及其构建方法,构建方法如下:信息采集,构建端到端的视觉‑气味多模态舒适度评价网络模型:所述网络模型由整洁度特征提取、气味伪图像特征提取、多模态信息评价组成;利用遗传算法结合反向传播学习法,针对多模态评价神经网络模型的关键参数进行优化:利用训练完毕的“端到端多模态评价网络模型”对车内环境舒适度进行多维度定量评价。本发明的方法能够有效地融合气味伪图像‑整洁度图像特征;相较于单独从异味或者整洁度角度评价车内环境的舒适度,整洁度‑异味两个维度信息有效融合后的评价结果准确性显著提高,评价结果具有更高的鲁棒性和参考价值。

    一种基于多模态短时特征的唇部状态识别方法

    公开(公告)号:CN114913511B

    公开(公告)日:2024-10-15

    申请号:CN202210649733.2

    申请日:2022-06-10

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于多模态短时特征的唇部状态识别方法,包括如下步骤:步骤1)利用人脸检测和特征点匹配技术,获取人脸及其主要特征点坐标;步骤2)利用相邻两帧唇部特征点坐标作输入,构建“唇部特征点短时特征提取网络模块”;步骤3)利用相邻两帧唇部图像作为输入,构建“唇部外观短时特征提取网络模块”;步骤4)将步骤2)和步骤3)的输出作为多模态输入,构建“唇部状态识别网络模块”;步骤5)按照步骤2)至步骤4)将各模块连接,构建“多模态特征唇部状态识别网络”;步骤6)训练“多模态特征唇部状态识别网络”,对待测图像序列进行唇部状态判定。本发明可利用短时特征序列准确预测唇部状态。

    一种基于多模态短时特征的唇部状态识别方法

    公开(公告)号:CN114913511A

    公开(公告)日:2022-08-16

    申请号:CN202210649733.2

    申请日:2022-06-10

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于多模态短时特征的唇部状态识别方法,包括如下步骤:步骤1)利用人脸检测和特征点匹配技术,获取人脸及其主要特征点坐标;步骤2)利用相邻两帧唇部特征点坐标作输入,构建“唇部特征点短时特征提取网络模块”;步骤3)利用相邻两帧唇部图像作为输入,构建“唇部外观短时特征提取网络模块”;步骤4)将步骤2)和步骤3)的输出作为多模态输入,构建“唇部状态识别网络模块”;步骤5)按照步骤2)至步骤4)将各模块连接,构建“多模态特征唇部状态识别网络”;步骤6)训练“多模态特征唇部状态识别网络”,对待测图像序列进行唇部状态判定。本发明可利用短时特征序列准确预测唇部状态。

    一种多视角无纸化在线考试作弊行为识别方法

    公开(公告)号:CN119152552A

    公开(公告)日:2024-12-17

    申请号:CN202410425700.9

    申请日:2024-04-10

    Applicant: 南通大学

    Abstract: 本发明公开一种多视角无纸化在线考试作弊行为识别方法,具体为,步骤1通过PC屏幕摄像头获得考生面部图像并预处理,利用迁移学习结合SwinTransformer网络,构建考生视线方向识别模块;步骤2通过侧俯视角摄像头获得考试桌面环境图像,利用迁移学习结合YOLOX网络,构建桌面环境物品识别模块;步骤3通过头戴式摄像头获得考生第一视角图像,利用迁移学习结合YOLOX构建考生第一视角下异常目标识别模块;步骤4根据上述检测结果,构建在线无纸化标准考试疑似作弊行为分类模块,判别考生在线考试疑似作弊的种类,抓拍三个视角下的作弊证据图像。本发明能够在无纸化在线考试时自动检测常见考试异常行为,为监考人员提供客观监考依据,减少人力成本的投入。

    基于对抗生成网络的多监测点协同空气污染物预测方法

    公开(公告)号:CN117636118A

    公开(公告)日:2024-03-01

    申请号:CN202311055531.6

    申请日:2023-08-21

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于对抗生成网络的多监测点协同空气污染物预测方法,包括如下步骤:步骤1,利用四个监测点6种常规污染物的实测数据和WRF‑CMAQ模型的“一次预测数据”作为“对抗生成网络优化模型”的输入信号;步骤2,建立“对抗生成网络优化模型”,利用四个监测点的WRF‑CMAQ模型的“一次预测数据”和实测数据生成四通道的二维矩阵“伪图像”数据,训练对抗生成网络结构参数;步骤3,利用训练好的“对抗生成网络优化模型”,对四个监测点6种常规污染物的浓度进行预测。本发明通过对抗生成网络实现对污染物浓度预测,有效减少传统WRF‑CMAQ模拟体系对空气质量预报的误差,显著提高空气质量检测的准确性与稳定性。

    一种多视角无纸化在线考试作弊行为识别方法

    公开(公告)号:CN116935464A

    公开(公告)日:2023-10-24

    申请号:CN202310706451.6

    申请日:2023-06-14

    Applicant: 南通大学

    Abstract: 本发明公开一种多视角无纸化在线考试作弊行为识别方法,具体为,步骤1通过PC屏幕摄像头获得考生面部图像并预处理,利用迁移学习结合SwinTransformer网络,构建考生视线方向识别模块;步骤2通过侧俯视角摄像头获得考试桌面环境图像,利用迁移学习结合YOLOX网络,构建桌面环境物品识别模块;步骤3通过头戴式摄像头获得考生第一视角图像,利用迁移学习结合YOLOX构建考生第一视角下异常目标识别模块;步骤4根据上述检测结果,构建在线无纸化标准考试疑似作弊行为分类模块,判别考生在线考试疑似作弊的种类,抓拍三个视角下的作弊证据图像。本发明能够在无纸化在线考试时自动检测常见考试异常行为,为监考人员提供客观监考依据,减少人力成本的投入。

    一种基于对抗生成网络的RGB-FIR多光谱图像去雾方法

    公开(公告)号:CN119090773A

    公开(公告)日:2024-12-06

    申请号:CN202411275755.2

    申请日:2024-09-12

    Applicant: 南通大学

    Abstract: 本发明提供一种基于对抗生成网络的RGB‑FIR多光谱图像去雾方法,涉及计算机视觉模型设计技术领域,本申请提供了基于对抗生成网络的RGB‑FIR多光谱图像去雾模型构建方法,步骤如下:S1:信息采集:S2:构建基于多级特征融合的RGB‑FIR多光谱去雾模型;S3:采用基于对抗生成的多效应学习策略,构建“融合‑增强”多重损失函数,利用RGB‑FIR图像数据集对模型训练,优化网络参数;S4:模型测试。上述模型充分考虑了由于RGB‑FIR两种光学图像由于其成像原理不同,在不同浓度的雾气条件下表现出的互补特性。本申请所提供的模型将RGB‑FIR两种模态的光学图像特征进行信息融合,实现多波段光学图像的优势互补,显著增强复原图像的细节、纹理和色彩信息,获取清晰的去雾效果。

    一种基于视觉-气味多传感器的出租车舒适度识别方法

    公开(公告)号:CN115909293A

    公开(公告)日:2023-04-04

    申请号:CN202211448323.8

    申请日:2022-11-18

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于视觉‑气味多传感器的出租车舒适度识别方法,包括如下步骤:步骤1)通过车载摄像头获取客座位置的图像,构建车内整洁度识别网络,对客座位置的整洁度进行识别;步骤2)利用气味传感器和单片机设计车内空气质量检测装置,对四种常见车内异味及其空气质量进行检测;步骤3)根据步骤1、2的检测结果,构建出租车舒适度函数,对车内环境舒适度进行评价;步骤4)设计用户界面,利用直观的车内图像、空气质量相关的数据与图表向用户提供选车依据。本发明能够在乘客在线选车时提供客观的参考,有效改善乘客出行舒适度。

Patent Agency Ranking