一种利用新型损失函数进行多人姿态估计的方法

    公开(公告)号:CN110163157A

    公开(公告)日:2019-08-23

    申请号:CN201910438591.3

    申请日:2019-05-24

    Abstract: 本发明公开一种利用新型损失函数进行多人姿态估计的方法,该发明使用的模型由两个关键的部分组成:候选关节的单人姿态估计和全局最大的关节关联算法。本发明使用全局视图解决目标干扰问题,采用自上而下的框架,首先检测个人,然后进行执行单人姿态估计,输出每个候选关节的位置列表,然后利用关联算法将候选关节点构成一个person-joints的连接图,最后用全局最大的关节联合算法求解图中关节点得出最终姿态。本发明使用图模型对每个关节和全局关联进行多重预测,对于拥挤场景中的不可避免的干扰以及非常有效的推理具有鲁棒性。

    一种基于图嵌入的社交网络中异常用户检测方法

    公开(公告)号:CN109949176A

    公开(公告)日:2019-06-28

    申请号:CN201910245861.9

    申请日:2019-03-28

    Abstract: 本发明公开了一种基于图嵌入的社交网络中异常用户检测方法,根据社交网络图中的用户节点和社区的归属关系值构建初始的用户节点嵌入模型,然后根据某个用户节点和其他用户节点建立目标函数,进而得到最终的用户节点嵌入模型,选取某个用户节点最终嵌入模型和其他用户节点之间的连接关系得到嵌入加权向量公式,根据嵌入加权向量公式采用数据归一化方法得到用户节点的异常水平公式,当用户节点异常水平大于最大阈值或者小于最小阈值定义为异常用户节点。本发明方法能够有效提升社交网络中异常用户节点检测的有效性和准确性。

    基于子群组划分与动量特征融合的人群运动行为识别方法

    公开(公告)号:CN109064484A

    公开(公告)日:2018-12-21

    申请号:CN201810236397.2

    申请日:2018-03-21

    Abstract: 本发明公开了一种基于子群组划分与动量特征融合的人群运动行为识别方法,该方法首先利用角点跟踪和背景建模的方法,获取视频图像帧中运动目标的时空信息,利用前景中群体分布的空间区域信息,将空间上相邻近的人群划分为若干子群体,子群体通过一段时间内的运动相关性进行进一步的分割,得到具有运动一致性的子群体;其次在子群体分割的基础上,提取出人群运动三个动量特征进行融合;最后将融合的特征以及视频帧的像素特征作为微分循环卷积神经网络的输入进行训练,采用人工标记的方法将训练视频片段标记成不同的描述词汇,用带标记的数据调整微分循环卷积神经网络的结果,得到了良好的训练成果,能够有效识别人群的运动行为,达到较好的效果。

    一种基于实时手势识别的手心追踪定位的方法

    公开(公告)号:CN108846356A

    公开(公告)日:2018-11-20

    申请号:CN201810596897.7

    申请日:2018-06-11

    Abstract: 本发明公开一种基于实时手势识别的手心追踪定位的方法。该方法首先对输入视频进行分割视频帧和图像预处理,然后通过动态阈值背景法检测算法抽取部分视频帧建立背景模,在此基础上利用YCrCb色彩空间肤色分割算法分割出手势图像,最后通过采用生物学的优化手心定位方法对手势跟踪定位后实现手势识别。本发明方法避免了误检视频中类肤色区域,提高了手势跟踪准确度和鲁棒性。

    一种基于视频人物唇读识别的时序集中预测方法

    公开(公告)号:CN111753704A

    公开(公告)日:2020-10-09

    申请号:CN202010562822.4

    申请日:2020-06-19

    Abstract: 本发明公开一种基于视频人物唇读识别的时序集中预测方法,首先输入人物唇动视频帧序列并提取唇部的时空特征,采用嵌入了SENet模块的残差网络获取多通道下人物唇部的有用特征,将特征输入双向门控循环单元得到唇动轮廓所对应字符的概率分布,并引入连接主义者的时间分类算法对齐时间步长上的各文本标签和字符;接着针对前后时序关系,利用双向门控循环单元的隐藏状态,建立时序关联的注意力窗口以集中成上下文向量,对该上下文向量在注意力窗口长度下的概率分布向量再次细分规划;最后对每个当前时间的概率分布向量设置注意力单元并重新汇集为能够预测唇读对应字符的概率。本发明通过对时序信息的前后集中关联,能有效预测和识别视频中人物唇读内容。

    一种基于级联特征提取的唇部检测及读取方法

    公开(公告)号:CN108710836A

    公开(公告)日:2018-10-26

    申请号:CN201810422275.2

    申请日:2018-05-04

    Abstract: 本发明公开一种基于级联特征提取的唇部检测及读取方法。该发明首先对输入视频的唇部区域进行检测,通过基于哈尔分类器和自适应推进算法的维奥拉琼斯方法实现唇部区域检测;然后先根据唇区色彩特征对检测区域进行阈值二值化以实现唇区提取,对唇区图像进行离散余弦变换,将视频图像信息集中于数据矩阵的某一区域,采取合适的筛选方式提取数据;然后通过主成分分析算法对贡献值较大的多个特征值进行维度提取,使数据进一步降维;根据一定规模的数据样本建立用于识别的序列字典树,使用莱文斯坦距离进行序列的相似度分析和模糊匹配;最后将每帧的静态特征与视频的动态特征相结合进行动态序列查询从而完成唇区的读取。本发明通过对唇区图像特征的多级提取和降维,能够提升唇读的速度和准确性,具有良好的实施性和鲁棒性。

    基于图像人物面部表情识别的特征提取优化方法

    公开(公告)号:CN108446640A

    公开(公告)日:2018-08-24

    申请号:CN201810237230.8

    申请日:2018-03-21

    Abstract: 本发明公开了一种基于图像人物面部表情识别的特征提取优化方法。该发明首先输入面部图像并用矩阵的形式表示,设置投影轴后,得到投影特征向量。设定给定图像的投影特征协方差矩阵,并以其迹表示最佳投影方向函数。根据训练样本图像的总体散布矩阵更新最佳投影方向函数,满足此函数最大值的投影轴组成的向量集合更新投影特征向量,并组成表示表情特征的矩阵。接着将特征矩阵中的每个元素再赋予权值,通过经高斯变异修改过的粒子群算法,优化最佳投影方向即全局最优解。最后把粒子群算法中的全局最优解分成二级群体,分为领导者和跟随者表示图像人物面部表情的多个主要部位进行二次优化和识别。该发明能够有效的辨别和优化人物面部的表情特征果。

    一种基于实时手势识别的手心追踪定位的方法

    公开(公告)号:CN108846356B

    公开(公告)日:2023-04-07

    申请号:CN201810596897.7

    申请日:2018-06-11

    Abstract: 本发明公开一种基于实时手势识别的手心追踪定位的方法。该方法首先对输入视频进行分割视频帧和图像预处理,然后通过动态阈值背景法检测算法抽取部分视频帧建立背景模型,在此基础上利用YCrCb色彩空间肤色分割算法分割出手势图像,最后通过采用生物学的优化手心定位方法对手势跟踪定位后实现手势识别。本发明方法避免了误检视频中类肤色区域,提高了手势跟踪准确度和鲁棒性。

    基于子群组划分与动量特征融合的人群运动行为识别方法

    公开(公告)号:CN109064484B

    公开(公告)日:2022-02-08

    申请号:CN201810236397.2

    申请日:2018-03-21

    Abstract: 本发明公开了一种基于子群组划分与动量特征融合的人群运动行为识别方法,该方法首先利用角点跟踪和背景建模的方法,获取视频图像帧中运动目标的时空信息,利用前景中群体分布的空间区域信息,将空间上相邻近的人群划分为若干子群体,子群体通过一段时间内的运动相关性进行进一步的分割,得到具有运动一致性的子群体;其次在子群体分割的基础上,提取出人群运动三个动量特征进行融合;最后将融合的特征以及视频帧的像素特征作为微分循环卷积神经网络的输入进行训练,采用人工标记的方法将训练视频片段标记成不同的描述词汇,用带标记的数据调整微分循环卷积神经网络的结果,得到了良好的训练成果,能够有效识别人群的运动行为,达到较好的效果。

    一种基于卷积自编码模型的唇部特征提取方法

    公开(公告)号:CN110163156A

    公开(公告)日:2019-08-23

    申请号:CN201910437384.6

    申请日:2019-05-24

    Abstract: 本发明公开一种基于卷积自编码模型的唇部特征提取方法,该发明首先通过对用户输入的视频逐帧提取唇部区域;然后对每帧唇部区域图像进行处理;处理完成后利用卷积自编码模型来提取唇部区域图像特征,最后将特征输入到LSTM进行训练,LSTM根据输入的特征对单词进行分类,从而完成对唇部的读取。本发明通过对唇部图像的压缩与重构,有助于帮助我们从唇部图像中提取视觉特征,从而得到更准确的潜在表示空间,能够有效提升唇读的准确性与可靠性。

Patent Agency Ranking