基于注意增强图卷积网络的骨架行为识别方法、系统

    公开(公告)号:CN110210372A

    公开(公告)日:2019-09-06

    申请号:CN201910454937.9

    申请日:2019-05-29

    Abstract: 本发明属于计算机视觉及模式识别领域,具体涉及了一种基于注意增强图卷积网络的骨架行为识别方法、系统,旨在解决如何有效学习人体骨架数据的时空特征并提升行为识别准确率的问题。本发明方法包括:获取人体骨架序列作为待识别骨架序列;通过训练好的骨架行为识别网络,获取预设行为的概率;选择概率最高的预设行为作为所述待识别骨架序列的预测行为。本发明不仅可以获取具有判别性的空间结构特征和时间动态特征,还可以获取时空之间的关系特征,利用注意机制自适应选择重要的信息,强化关键部位的信息,获取更加鲁棒的表示。

    基于深度自编码器的人眼检测和定位方法

    公开(公告)号:CN105205453B

    公开(公告)日:2019-01-08

    申请号:CN201510537480.X

    申请日:2015-08-28

    Inventor: 王亮 黄永祯 唐微

    Abstract: 本发明公开了一种用于人眼检测和定位的方法,包括:对带有标定好的人眼矩形框位置的训练集中的所有图像,利用人眼矩形框位置生成二值化的标签图;在图像上随机取小图像块,无监督地分层训练多个自编码器以构建深度自编码器,并利用自编码器中各层的权重对深度自编码器进行初始化;在原图像和标签图的相同位置上随机取小原图像块和小标签图像块,以小标签图像块作为监督信息,以小原图像块为输入,优化深度自编码器;在待测图像上以滑动窗口的方式生成多个小待测图像块,利用深度自编码器得到每个小待测图像块的小待测标签图像块并将其合并在一起,得到待测图像的待测标签图,对待测标签图进行二值化,利用坐标投影或寻找轮廓得到人眼的位置。

    基于分割剪影的行人再识别方法及系统

    公开(公告)号:CN109101866A

    公开(公告)日:2018-12-28

    申请号:CN201810567647.0

    申请日:2018-06-05

    Inventor: 王亮 黄岩 宋纯锋

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于分割剪影的行人再识别方法及系统,旨在解决如何消除图像背景噪声,提高行人再识别准确率的问题。为此目的,本发明中的行人再识别方法包括:基于预先构建的行人再识别模型并根据待测行人的彩色图像及对应的分割剪影,获取待测行人的行人特征;分别计算行人特征与每个预设的行人身份特征之间的相似度;获取最大相似度对应的行人身份特征,并根据所获取的行人身份特征获取待测行人的身份信息。基于本发明的行人再识别方法可以较好的解决背景杂乱情况下的行人再识别问题,提高识别准确率。同时,本发明中的行人再识别系统能够执行并实现上述方法。

    目标体的动作行为识别方法及装置

    公开(公告)号:CN108629326A

    公开(公告)日:2018-10-09

    申请号:CN201810455262.5

    申请日:2018-05-14

    Abstract: 本发明属于计算机视觉技术领域,具体涉及一种目标体的动作行为识别方法及装置,旨在解决如何准确识别具有相似背景的视频中动作行为的技术问题。为此目的,本发明中目标体的动作行为识别方法包括:基于预先构建的行为识别模型,获取目标体的时序视频特征,并根据所获取的时序视频特征,预测每个预设的所述目标体的动作行为类别对应的类属概率;根据预测结果,确定目标体的动作行为类别。基于本发明的方法,可以很好地捕捉视频整体的特征,以此能够很好的识别出具有相似背景及易混淆的视频中动作行为。

    基于双流生成对抗网络的跨视角步态识别装置及训练方法

    公开(公告)号:CN108596026A

    公开(公告)日:2018-09-28

    申请号:CN201810217938.7

    申请日:2018-03-16

    Abstract: 本发明属于计算机视觉和模式识别领域,具体涉及一种基于双流生成对抗网络的跨视角步态识别装置及训练方法。旨在解决跨视角步态识别准确率不高的问题。具体包括:通过一个全局流生成对抗网络模型学习一个标准角度的全局流步态能量图像;利用三个局部流生成对抗网络模型学习标准角度的局部流步态能量图像;该方法中的全局流模型能够学到全局步态特征,在全局流模型的基础上,加入局部流网络,可以学到局部步态特征;通过在双流生成对抗网络的生成器上加入像素级约束可以恢复步态细节;通过将全局步态特征和局部步态特征进行融合,可以提升步态识别准确率。该方法对于步态图像具有极强的鲁棒性,可以较好的解决跨视角步态识别问题。

    一种基于深度学习的文字检测方法及装置

    公开(公告)号:CN105184312B

    公开(公告)日:2018-09-25

    申请号:CN201510522970.2

    申请日:2015-08-24

    Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。

    基于高阶用户偏好的推荐方法

    公开(公告)号:CN105069140B

    公开(公告)日:2018-07-27

    申请号:CN201510511083.5

    申请日:2015-08-19

    Abstract: 种基于高阶用户偏好的推荐方法,包括:利用用户‑物品评分数据集,计算用户对成对物品的高阶偏好值,构建用户‑物品‑物品成对偏好数据集;初始化模型,从正态分布中随机选取值对模型初始化;从评分数据集和成对偏好数据集中选择相关数据;计算误差和用户偏好相似度,构成最优化准则;计算偏好指标梯度,更新模型;重复步骤直到模型参数收敛。本发明方法由OPTRP最优化准则和LearnRP学习算法组成,通过学习可以产生已有CF模型,且还可产生新模型,能有效地处理高度偏斜的评分数据集,使得推荐系统的预测精度和推荐准确度都得到提高,在真实场景中有重要的应用价值。

    基于循环神经网络构建预测模型的方法

    公开(公告)号:CN106777874A

    公开(公告)日:2017-05-31

    申请号:CN201611027689.2

    申请日:2016-11-18

    Inventor: 吴书 王亮 谭铁牛

    CPC classification number: G06N3/049 G06N3/08 G16H50/20

    Abstract: 本发明公开了一种基于循环神经网络构建血压序列预测模型的方法,该预测模型能够根据用户历史的血压序列预测用户未来的血压趋势。包括:获取多组特征数据,所述特征数据包括血压特征、月份特征、月份间隔特征以及用户个人信息特征;将所述多组特征数据依次输入到循环神经网络模型中进行训练,其中:根据输入每组特征数据得到的输出血压预测结果更新所述循环神经网络模型的参数;以及用下一组特征数据训练更新后的循环神经网络模型,直到所述循环神经网络模型的参数收敛。本发明基于循环神经网络模型来解决序列预测问题,将时序信息充分利用,通过将其输入到同一隐含层来获得更高维度的表达,以此提高模型预测的准确度。

Patent Agency Ranking