-
公开(公告)号:CN110059582B
公开(公告)日:2023-04-07
申请号:CN201910242262.1
申请日:2019-03-28
Applicant: 东南大学
IPC: G06V20/59 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于多尺度注意力卷积神经网络的驾驶员行为识别方法,包括如下步骤:(1)拍摄驾驶员行为识别的图像数据集;(2)对拍摄得到的驾驶员行为数据集做数据增强并将增强得到的样本同时纳入训练数据中;(3)构建神经网络模型,包括三个模块,分别为:多尺度卷积模块、注意力模块和分类模块;(4)训练多尺度注意力卷积神经网络;使用Pytorch开源工具搭建网络模型,使用随机梯度下降方法优化网络参数;(5)对多列卷积神经网络进行测试。本发明将多尺度模型和注意力机制引入到驾驶员行为识别任务中用于提取具有区分度的行为细粒度特征表示,可进一步提高驾驶员行为识别准确率。
-
公开(公告)号:CN112101103A
公开(公告)日:2020-12-18
申请号:CN202010790835.7
申请日:2020-08-07
Applicant: 东南大学
Abstract: 本发明涉及了一种基于深度集成网络的视频驾驶员疲劳检测方法,框架包含风格迁移模块、人脸关键点检测模块和分类模块,风格迁移模块由一个编解码生成网络构成,用于复原输入红外视频帧的颜色信息,输出彩色视频帧;人脸关键点检测模块采用全卷积神经网络结构,以红外视频帧和风格迁移模块生成的彩色视频帧作为输入,对人脸关键点进行定位并输出掩膜特征图;分类模块由一个3D卷积神经网络组成,集成红外视频序列的时空信息、彩色视频序列的颜色信息、和掩膜特征序列的显著性信息,判定驾驶员疲劳状态。相比现有的疲劳驾驶检测算法,本发明检测率高,误报率低,可用于红外监控视频下的驾驶员疲劳检测。发明在智能交通领域有重要的应用价值。
-
公开(公告)号:CN110309723A
公开(公告)日:2019-10-08
申请号:CN201910483030.5
申请日:2019-06-04
Applicant: 东南大学
Abstract: 本发明提供了一种基于人体特征细分类的驾驶员行为识别方法,包括:建立驾驶员行为识别的图像数据集;构建基于人体特征细分类的识别模型;训练基于人体特征细分类的识别模型;对基于人体特征细分类的识别模型进行测试。本发明能够对人体关键点部位进行正确的动作分类,结合局部特征和图像全局特征进行驾驶员行为细分类,在交通安全领域有重要的应用价值。本发明通过Stacked Hourglass Networks模型进行关键点定位,随后,对关键点区域进行学习,将人体部位的具体动作作为卷积分类的中层特征,显著地提升了模型的识别精度。
-
公开(公告)号:CN110298257A
公开(公告)日:2019-10-01
申请号:CN201910483000.4
申请日:2019-06-04
Applicant: 东南大学
Abstract: 本发明提供了一种基于人体多部位特征的驾驶员行为识别方法,包括:建立驾驶员行为识别的图像数据集;构建神经网络模型;训练基于人体多部位特征的驾驶员行为识别模型;对基于人体多部位特征的驾驶员行为识别模型进行测试。本发明结合人体关键点区域与全局区域,利用某些具有判别力的局部区域进行驾驶员行为识别,由于融合人体关键点特征,进一步提高驾驶员行为识别准确率,在交通安全领域有重要的应用价值。
-
公开(公告)号:CN108875674A
公开(公告)日:2018-11-23
申请号:CN201810692685.9
申请日:2018-06-29
Applicant: 东南大学
Abstract: 本发明提供了一种基于多列融合卷积神经网络的驾驶员行为识别方法,包括:构建驾驶员行为识别数据集;对数据集的图片做数据增强;构建深度学习架构;训练设计好的深度学习模型;测试模型得出识别结果。本发明采用了深层的深度学习架构,有利于提取出更抽象的分层特征用于驾驶员行为分类;采用了多个不同滤波核的卷积神经网络分支融合的深度学习架构,有利于提取出图像多尺度特征,用于驾驶员行为分类。本发明中所设计的多列融合卷积神经网络有更抽象的局部特征表示能力,可进一步提高驾驶员行为识别的准确率,在公共安全和智能交通中有重要的应用价值。
-
公开(公告)号:CN114241457B
公开(公告)日:2024-12-17
申请号:CN202111564312.1
申请日:2021-12-20
Applicant: 东南大学
IPC: G06V20/59 , G06V40/20 , G06V10/44 , G06V10/82 , G06V10/80 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种通过关键点条件网络监控机动车辆驾驶员的方法,显式地提取与动作相关的关键点特征。网络包含全局分支和关键点分支。在全局分支中利用改进的空洞金字塔池化层来捕获多尺度的全局上下文,在关键点分支中提出了一个关键点条件计算模块来增强特征的可分辨性。在分类过程中,每个输入图像并不共享相同的全连接层参数,而是在关键点特征的指导下,通过条件计算生成专家权值,使模型能够适应相应类别的驾驶图像。本发明通过生成关键点增强注意力以缩放分类特征,提高了分类准确率和鲁棒性,在交通安全领域有重要的应用价值。
-
公开(公告)号:CN110309723B
公开(公告)日:2023-08-01
申请号:CN201910483030.5
申请日:2019-06-04
Applicant: 东南大学
IPC: G06V40/20 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/084 , G06N3/0464
Abstract: 本发明提供了一种基于人体特征细分类的驾驶员行为识别方法,包括:建立驾驶员行为识别的图像数据集;构建基于人体特征细分类的识别模型;训练基于人体特征细分类的识别模型;对基于人体特征细分类的识别模型进行测试。本发明能够对人体关键点部位进行正确的动作分类,结合局部特征和图像全局特征进行驾驶员行为细分类,在交通安全领域有重要的应用价值。本发明通过Stacked Hourglass Networks模型进行关键点定位,随后,对关键点区域进行学习,将人体部位的具体动作作为卷积分类的中层特征,显著地提升了模型的识别精度。
-
公开(公告)号:CN112101103B
公开(公告)日:2022-08-09
申请号:CN202010790835.7
申请日:2020-08-07
Applicant: 东南大学
Abstract: 本发明涉及了一种基于深度集成网络的视频驾驶员疲劳检测方法,框架包含风格迁移模块、人脸关键点检测模块和分类模块,风格迁移模块由一个编解码生成网络构成,用于复原输入红外视频帧的颜色信息,输出彩色视频帧;人脸关键点检测模块采用全卷积神经网络结构,以红外视频帧和风格迁移模块生成的彩色视频帧作为输入,对人脸关键点进行定位并输出掩膜特征图;分类模块由一个3D卷积神经网络组成,集成红外视频序列的时空信息、彩色视频序列的颜色信息、和掩膜特征序列的显著性信息,判定驾驶员疲劳状态。相比现有的疲劳驾驶检测算法,本发明检测率高,误报率低,可用于红外监控视频下的驾驶员疲劳检测。发明在智能交通领域有重要的应用价值。
-
公开(公告)号:CN110717389B
公开(公告)日:2022-05-13
申请号:CN201910824620.X
申请日:2019-09-02
Applicant: 东南大学
Abstract: 本发明公开了基于生成对抗和长短期记忆网络的驾驶员疲劳检测方法,网络架构由3D条件生成对抗网络和双向长短期记忆网络组成,3D条件生成对抗网络用于从短期视频剪辑中提取疲劳相关特征,其中3D生成网络由一个编解码U‑NET网络作为骨架网络,以疲劳相关标签作为条件,生成视频剪辑;3D判别网络将真实剪辑和合成剪辑作为输入,提取带有疲劳相关信息的短期时空特征表示。双向长短期记忆网络用于长期时空特征融合,捕捉帧间的上下文信息,并最终输出每帧的疲劳检测结果。对比目前现有的驾驶员疲劳检测方法,本发明泛化性强,识别准确率高,可用于监控视频下的实时驾驶员疲劳识别。发明在交通安全领域有重要的应用价值。
-
公开(公告)号:CN114241457A
公开(公告)日:2022-03-25
申请号:CN202111564312.1
申请日:2021-12-20
Applicant: 东南大学
Abstract: 本发明公开了一种通过关键点条件网络监控机动车辆驾驶员的方法,显式地提取与动作相关的关键点特征。网络包含全局分支和关键点分支。在全局分支中利用改进的空洞金字塔池化层来捕获多尺度的全局上下文,在关键点分支中提出了一个关键点条件计算模块来增强特征的可分辨性。在分类过程中,每个输入图像并不共享相同的全连接层参数,而是在关键点特征的指导下,通过条件计算生成专家权值,使模型能够适应相应类别的驾驶图像。本发明通过生成关键点增强注意力以缩放分类特征,提高了分类准确率和鲁棒性,在交通安全领域有重要的应用价值。
-
-
-
-
-
-
-
-
-