一种基于GRU的连续性视线估计深度学习方法

    公开(公告)号:CN117292421B

    公开(公告)日:2024-05-28

    申请号:CN202311173058.1

    申请日:2023-09-12

    Applicant: 南通大学

    Inventor: 王可 王进 曹硕裕

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于GRU的连续性视线估计深度学习方法,步骤如下:定义图像特征空间和GRU的隐藏状态空间维度;利用预训练的ResNet‑50模型,对输入的人脸图像进行特征提取并进行特征降维处理;处理图像特征向量,得到模型隐藏状态;将隐藏状态输入到GRU进行时间序列建模,生成输出向量;对输出向量进行特征映射,得到新的特征向量;将新的特征向量映射为三维输出向量;对三维输出向量的前两个元素进行双曲正切变换;对三维输出向量的第三个元素通过sigmoid函数变换;利用PinBall损失函数度量预测结果与真实值之间的误差。本发明中同时使用了ResNet‑50模型和GRU模型,在连续性视线估计任务中具有高准确性和有效性。

    一种基于回调的深度神经网络错误定位方法

    公开(公告)号:CN117744714A

    公开(公告)日:2024-03-22

    申请号:CN202311835225.4

    申请日:2023-12-28

    Applicant: 南通大学

    Abstract: 本发明公开了一种基于回调的深度神经网络错误定位方法,分为模型准备、错误检测、统计分析三个步骤。在模型准备阶段,选择合理的DNN模型以满足问题需求。错误检测阶段持续跟踪关键参数,通过回调机制监控训练损失、验证损失、训练准确率和验证准确率等参数。统计分析阶段运用滑动平均、变化率计算、阈值判定和可视化分析等方法,准确定位模型中的错误,提高深度学习模型的诊断精度和全面性。针对DNN模型中的欠拟合和过拟合问题进行错误定位,实现了对深度学习模型训练问题的实时诊断与定位,提高了定位的全面性和精确性,为深度学习模型的错误诊断提供更加全面的支持。

    一种在线学习专注度监测方法及系统

    公开(公告)号:CN117315536A

    公开(公告)日:2023-12-29

    申请号:CN202311240937.1

    申请日:2023-09-25

    Applicant: 南通大学

    Abstract: 本发明公开了一种在线学习专注度监测方法及系统,首先构建数据采集模块、特征提取模块,然后计算眼睛纵横比、嘴部纵横比、头部姿态欧拉角、并构建视线估计模型,然后构建注意力检测模块,通过输入在线学习者的视频,获得眼睛纵横比、嘴部纵横比、头部姿态欧拉角、眼睛视线方向,然后应用注意力检测模块,设置注意力检测模块阈值,大于等于阈值判断为注意力分散,小于阈值为注意力集中;本发明仅需要带摄像头的电脑,不需要佩戴其他额外的仪器,就可以判断在线学习者注意力是否集中,学生常用的笔记本电脑即可满足本发明的环境要求,本发明具有开销较小、较为便利、较强的鲁棒性、较好的精准度等优点。

    一种基于GRU的连续性视线估计深度学习方法

    公开(公告)号:CN117292421A

    公开(公告)日:2023-12-26

    申请号:CN202311173058.1

    申请日:2023-09-12

    Applicant: 南通大学

    Inventor: 王可 王进 曹硕裕

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于GRU的连续性视线估计深度学习方法,步骤如下:定义图像特征空间和GRU的隐藏状态空间维度;利用预训练的ResNet‑50模型,对输入的人脸图像进行特征提取并进行特征降维处理;处理图像特征向量,得到模型隐藏状态;将隐藏状态输入到GRU进行时间序列建模,生成输出向量;对输出向量进行特征映射,得到新的特征向量;将新的特征向量映射为三维输出向量;对三维输出向量的前两个元素进行双曲正切变换;对三维输出向量的第三个元素通过sigmoid函数变换;利用PinBall损失函数度量预测结果与真实值之间的误差。本发明中同时使用了ResNet‑50模型和GRU模型,在连续性视线估计任务中具有高准确性和有效性。

Patent Agency Ranking