一种基于Transformer改进的人体骨架数据行为识别方法及系统

    公开(公告)号:CN116343340A

    公开(公告)日:2023-06-27

    申请号:CN202310358481.2

    申请日:2023-04-06

    Inventor: 孙圣锟 刘光灿

    Abstract: 本发明公开了一种基于Transformer改进的人体骨架数据行为识别方法及系统,涉及计算机视觉行为识别领域,包括以下步骤:接收原始人体骨架数据,将原始人体骨架数据在时间维度分为多个部分,每个部分为一个时空组,且所述时空组包含等量的人体骨架数据帧数;对每个时空组对于空间位置进行编码,得到编码人体骨架数据;将编码人体骨架数据输入预先建立的时空分组自注意力模型内,得到各个关节点之间的关系;对获得的关节点之间的关系特征进行组间特征聚合得到聚合特征;将聚合特征输入到全局平均池化层和全连接层以获得分类分数。

    目标检测网络优化方法、目标检测方法、装置和存储介质

    公开(公告)号:CN115131653A

    公开(公告)日:2022-09-30

    申请号:CN202210750415.5

    申请日:2022-06-28

    Inventor: 王文青 刘光灿

    Abstract: 本发明公开了一种目标检测网络优化方法、目标检测方法、装置和存储介质,所述优化方法基于通道注意力机制的多通道注意力机制(CASSPP)方法,对特征图中重要目标特征信息从局部到全局的双重关注,并最终都作用在通过空间金字塔池化SPP和通道注意力机制融合后的特征图上,能够满足目标检测当中需要的较大的感受野,也能够更好的关注需要检测的目标。本发明方法使目标检测模型能够在学习的过程中既关注特征图通道的重要性,又关注到特征图空间上不同区域的重要性,同时能够扩大感受野,能够有效的提高目标检测的性能。

    一种基于三阶张量自编码网络的视频压缩方法

    公开(公告)号:CN109302614B

    公开(公告)日:2022-01-18

    申请号:CN201811168316.6

    申请日:2018-10-08

    Abstract: 本发明提出了一种基于三阶张量自编码网络的视频压缩方法。自编码网络在图像压缩中得到了广泛的使用,但是其需要存储大量的参数和需要大量的图片进行训练网络,为此本文使用三阶张量来代替自编码网络中层与层之间的全连接参数,使用自编码机制和反向传播方法对网络中参数进行迭代求解达到收敛,并对收敛结果进行编码,最终得到压缩后的视频。

    基于高斯极值滤波和群稀疏RPCA的运动目标检测方法

    公开(公告)号:CN107564029B

    公开(公告)日:2021-09-03

    申请号:CN201710606938.1

    申请日:2017-07-24

    Abstract: 本发明公开了基于高斯极值滤波和群稀疏RPCA的运动目标检测方法。针对动态背景下的运动目标检测问题,提出了一种基于高斯极值滤波(Gaussian max‑pooling)和群稀疏RPCA(Robust Principal Component Analysis)的运动目标检测方法,此方法包含两个主要模块:1)提出一种称为高斯极值滤波的新方法,为每一个像素点重新估计重一个最合适的灰度值,从而减小动态背景对目标检测的影响;2)提出一个称为群稀疏RPCA的新模型,对运动目标帧内和帧间的连续性进行建模,以实现更精确的运动目标检测。本发明在动态背景下比其它同类方法有更高的检测精度,能为视频监控系统提供一种更有效的运动目标检测算法。

    一种基于双流网络的行为识别方法

    公开(公告)号:CN109993077A

    公开(公告)日:2019-07-09

    申请号:CN201910202628.2

    申请日:2019-03-18

    Inventor: 朱轶昇 刘光灿

    Abstract: 本发明公开了一种基于双流网络的行为识别方法,属于机器视觉及行为识别领域,网络部分:对于一个输入视频,将其分成k个片段,对每个片段,将对应的经过处理后的图片得到对应的分类准确率,将所有的片段融合得到最终的分类准确率。网络训练部分:通过使用多尺度裁剪,颜色抖动,随机翻转等方法解决了训练数据少产生的过拟合问题。时间段网络通过从k个片段中学习视频的特征,关注到了视频的全局信息而非局部,与3维卷积网络方法相比,3维卷积网络虽然能关注全局的视频信息,但参数量巨大,时间段网络不管在参数量还是在计算量上都比3维卷积更小。时间段网络是传统两种方法的综合,既注重视频全局信息,又不会带来很大的参数和计算量。

    一种年龄估计方法
    16.
    发明公开

    公开(公告)号:CN108960123A

    公开(公告)日:2018-12-07

    申请号:CN201810691274.8

    申请日:2018-06-28

    CPC classification number: G06K9/00268 G06K9/00228 G06K2009/00322

    Abstract: 本发明公开了一种年龄估计方法,包括以下步骤:(1)对数据集中的图片通过人脸检测算法提取脸部特征;(2)将提取的脸部特征分为少年、青年、壮年、盛年、达年、中年和老年,其中少年和老年特征直接通过线性支持向量机进行提取,青年、壮年、盛年、达年和中年五个年龄阶段特征采用加入了时间约束的AGRC编码框架进行解码。采用本发明方法有效提高了年龄估计的准确率。

    一种基于全局与局部特征的图像深度估计方法及装置

    公开(公告)号:CN115272437A

    公开(公告)日:2022-11-01

    申请号:CN202210959545.X

    申请日:2022-08-11

    Inventor: 胡高杰 刘光灿

    Abstract: 本发明公开了一种基于全局与局部特征的图像深度估计方法及装置,包括:1)数据预处理;2)提取输入图像中的全局特征与局部特征;3)融合全局特征与局部特征;4)解码预测。本发明方法引入了一种新的仅用于深度估计任务的数据增强方法,能够使得模型在编码阶段既可以提取彩色图像的全局特征,也可以提取局部特征,以及在解码阶段利用我们设计的融合模块结合不同特征的同时预估稠密的、高质量的深度图,并且在额外的数据集上表现出了更强的泛化性能。

    一种结合图像掩码的交通标志检测方法、设备及存储介质

    公开(公告)号:CN115063779A

    公开(公告)日:2022-09-16

    申请号:CN202210752071.1

    申请日:2022-06-28

    Inventor: 王文青 刘光灿

    Abstract: 本发明提供一种结合图像掩码的交通标志检测方法、设备及存储介质,涉及计算机科学人工智能领域。该结合图像掩码的交通标志检测方法,包括:颜色掩码及对应权重生成,通过图像中的红黄蓝三种颜色区域进行颜色掩码的生成,并通过该掩码生成对应损失权重;纹理掩码及对应权重生成,利用图像纹理掩码在易分负样本中再次进行划分;损失值调整;评估,在交通标志数据集TT100K上进行实验,并以COCO指标进行实验结果对比解决了在交通标志检测任务中非交通标志指示牌被误检为交通标志的问题。

    一种基于三阶张量自编码网络的视频压缩方法

    公开(公告)号:CN109302614A

    公开(公告)日:2019-02-01

    申请号:CN201811168316.6

    申请日:2018-10-08

    Abstract: 本发明提出了一种基于三阶张量自编码网络的视频压缩方法。自编码网络在图像压缩中得到了广泛的使用,但是其需要存储大量的参数和需要大量的图片进行训练网络,为此本文使用三阶张量来代替自编码网络中层与层之间的全连接参数,使用自编码机制和反向传播方法对网络中参数进行迭代求解达到收敛,并对收敛结果进行编码,最终得到压缩后的视频。

    一种基于时空卷积特征的表情分类方法

    公开(公告)号:CN108960122A

    公开(公告)日:2018-12-07

    申请号:CN201810691249.X

    申请日:2018-06-28

    CPC classification number: G06K9/00288 G06K9/00302 G06K9/6256 G06N3/0454

    Abstract: 本发明公开了一种基于时空卷积特征的表情分类方法,该表情分类方法通过改进的卷积神经网络inception‑w进行人脸深度特征提取,然后将提取的特征送到基于深度残差的长短期记忆网络Deep‑Res‑Bi‑LSTM中进行分类,形成端到端的训练网络。本发明提出的方法不仅考虑了时间和空间上的联系,同时在提取空间信息时加深了网络层数并减少参数,在提取时间信息网络的时间(使用双向连接)和空间(深度堆叠残差连接)维度上都有所提升。

Patent Agency Ranking