一种基于全时空卷积模块的暴力视频检测算法

    公开(公告)号:CN112668495B

    公开(公告)日:2024-02-02

    申请号:CN202011619964.6

    申请日:2020-12-30

    Applicant: 东北大学

    Abstract: 本发明公开了一种基于全时空卷积模块的暴力视频检测算法,基于全时空卷积模块的暴力视频检测算法实现了时序特征在局部空间和全时序的特征融合,能够有效地提取了暴力视频的局部空间和全时序特征,有效提高了检测的准确度和模型的泛化能力,该方法相比于以往的2DCNN+LSTM和基于3DCNN的相关算法在暴力视频检测领域具有更大的优势。本发明中的全时空卷积模块可以被应用在其他的网络架构中,充分利用其时间空间的特征融合能力来达到更好的视频行为分类效果。(56)对比文件Yutong Cai等.Multi-scalespatiotemporal information fusion networkfor video action recognition《.2018 IEEEVisual Communications and ImageProcessing 》.2019,正文1-4.Zhenhua T等.FTCF: Full temporal crossfusion network for violence detection invideos《. Applied Intelligence 》.2022,第53卷4218-4230.

    一种基于动作空间约束的离线强化学习方法

    公开(公告)号:CN115965050A

    公开(公告)日:2023-04-14

    申请号:CN202211605184.5

    申请日:2022-12-14

    Applicant: 东北大学

    Inventor: 毛克明 张笑桐

    Abstract: 本发明设计一种基于动作空间约束的离线强化学习方法,利用在线RL算法在基准数据集上获取离线数据集,使用异策略Q‑learning在离线数据集中收集多条轨迹样本存入回放缓存中,然后对当前学习策略进行策略评估;利用深度神经网络来计算预估价值Q;处理分布转移带来的影响,利用VAE训练得到的生成模型生成与离线数据集相似的动作集合,并通过Q选择价值最高的动作;利用随机集成混合方法来训练多个Q值的估计,并将其加权组合得到更加精确的Q值估计,减少神经网络近似Q值带来的评估误差;当训练次数结束时,更新最终的策略参数,将训练好的策略在现实环境进行交互并评估;验证在离线数据集训练好的策略在在线是否表现良好。

    一种扩充目标识别的训练数据的图像合成方法

    公开(公告)号:CN108492343B

    公开(公告)日:2021-09-21

    申请号:CN201810260915.4

    申请日:2018-03-28

    Applicant: 东北大学

    Abstract: 本发明提供一种扩充目标识别的训练数据的图像合成方法,涉及计算机视觉技术领域。该方法针对特定生产场景中的图像数据,进行规模和种类统计,采用K‑Means聚类区分前景图像与底图,将前景与底图以及带有标记的特定场景数据集进行合成,用合成数据来扩充图像数据集。本发明的方法能够自动爬取相关素材图片并将所需素材提取并合成到指定的用户特定场景下,从而在短时间、低成本下获得一定规模的合成数据集达到扩充数据集从而提高其鲁棒性,为增强深度学习模型识别能力提供辅助。

    一种基于图卷积神经网络的人类动作识别方法

    公开(公告)号:CN112633209A

    公开(公告)日:2021-04-09

    申请号:CN202011600579.7

    申请日:2020-12-29

    Applicant: 东北大学

    Inventor: 毛克明 李翰鹏

    Abstract: 本发明公开了一种基于图卷积神经网络的人类动作识别方法,准备人类动作视频数据,并进行标注,并根据不同种类的动作对视频标签进行标注;使用openpose姿态估计算法对人类动作视频数据进行骨骼关键点特征的提取,然后通过骨骼点主流网络计算相邻帧骨骼关键点变化速度并进行特征拼接;对骨骼关键点进行筛选并通过角度分支网络计算筛选的骨骼关键点的夹角并进行特征拼接;将拼接好的数据传入图神经网络;将图卷积从空间域扩展到时间域;使用一个交叉注意力模型来增强网络的性能;人类动作识别。本发明能够将输入的视频中的人类所表现的动作识别出来并输出,并具有良好的易用性和鲁棒性,为人工智能技术在动作识别领域实际落地奠定一定的基础。

    基于压缩卷积神经网络的加热金属图像的多标签分类方法

    公开(公告)号:CN110298397A

    公开(公告)日:2019-10-01

    申请号:CN201910553736.4

    申请日:2019-06-25

    Applicant: 东北大学

    Abstract: 本发明提出基于压缩卷积神经网络的加热金属图像的多标签分类方法,包括:获取加热金属图像,组成训练集和验证数据集;设计应用图像分类的压缩卷积神经网络模型框架;使用压缩卷积神经网络模型及训练集对应的文件进行模型训练,得到用于加热金属图像的自动分类模型;对验证数据集中的加热金属图像的进行预测,得到加热金属图像预测分类。与传统的方法比较,本发明有效利用深度学习特征的特征提取能力以及泛化能力,提高加热金属图像检测识别的准确度。而且压缩网络的深度学习模型占用存储空间小,对硬件的性能要求低,训练所需的时间更少。大大提高了训练模型的效率,图像识别率准确度降低相对较小,便于在于移动或嵌入式设备上实现场景。

    一种基于自动编码器构建特征表示的肺结节图像分类方法

    公开(公告)号:CN109902736A

    公开(公告)日:2019-06-18

    申请号:CN201910136884.6

    申请日:2019-02-25

    Applicant: 东北大学

    Abstract: 本发明提供一种基于自动编码器构建特征表示的肺结节图像分类方法,涉及计算机视觉技术领域。该方法首先将肺结节图像通过超像素分割为局部斑块;然后使用无监督深度自动编码器将这些斑块变换为固定长度的局部特征向量;并基于局部特征构建视觉词汇,通过视觉词袋描述肺结节图像的全局特征;用softmax算法对肺结节类型分类,完成用于肺结节图像特征表示的模型框架的设计;使用设计的模型框架及ELCAP数据集进行训练,得到用于肺结节图片自动分类模型;最后使用得到的肺结节图像分类模型,进行肺结节图像分类。本发明提供的基于自动编码器构建特征表示的肺结节图像分类方法,提升了肺结节分类模型的特征提取能力,提高了肺结节自动分类的准确率。

    一种扩充目标识别的训练数据的图像合成方法

    公开(公告)号:CN108492343A

    公开(公告)日:2018-09-04

    申请号:CN201810260915.4

    申请日:2018-03-28

    Applicant: 东北大学

    Abstract: 本发明提供一种扩充目标识别的训练数据的图像合成方法,涉及计算机视觉技术领域。该方法针对特定生产场景中的图像数据,进行规模和种类统计,采用K-Means聚类区分前景图像与底图,将前景与底图以及带有标记的特定场景数据集进行合成,用合成数据来扩充图像数据集。本发明的方法能够自动爬取相关素材图片并将所需素材提取并合成到指定的用户特定场景下,从而在短时间、低成本下获得一定规模的合成数据集达到扩充数据集从而提高其鲁棒性,为增强深度学习模型识别能力提供辅助。

Patent Agency Ranking