基于生成对抗网络的帧率增强步态识别方法及装置

    公开(公告)号:CN108681689B

    公开(公告)日:2021-06-04

    申请号:CN201810282478.6

    申请日:2018-04-02

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于生成对抗网络的帧率增强步态识别方法及装置,旨在降低识别图像的噪声,提高步态识别的准确率。该方法具体包括:首先通过一个生成对抗网络生成数据集中连续两帧之间的帧,然后将生成帧与原始帧合并计算步态能量图,然后通过步态能量图识别网络对个体进行识别。该方法中的生成对抗网络能够显著提高原始图像序列的帧率,同时生成的图像对噪声具有较好的鲁棒性,能够起到对步态能量图进行降噪的作用,同时在步态能量图识别网络中加入了新型边界比率损失函数,能够极好地平衡不同损失函数之间的量级,大大提升模型训练的稳定性。本方法能够明显提升跨视角及不跨视角的步态识别率。

    基于分割剪影的行人再识别方法及系统

    公开(公告)号:CN109101866B

    公开(公告)日:2020-12-15

    申请号:CN201810567647.0

    申请日:2018-06-05

    Inventor: 王亮 黄岩 宋纯锋

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于分割剪影的行人再识别方法及系统,旨在解决如何消除图像背景噪声,提高行人再识别准确率的问题。为此目的,本发明中的行人再识别方法包括:基于预先构建的行人再识别模型并根据待测行人的彩色图像及对应的分割剪影,获取待测行人的行人特征;分别计算行人特征与每个预设的行人身份特征之间的相似度;获取最大相似度对应的行人身份特征,并根据所获取的行人身份特征获取待测行人的身份信息。基于本发明的行人再识别方法可以较好的解决背景杂乱情况下的行人再识别问题,提高识别准确率。同时,本发明中的行人再识别系统能够执行并实现上述方法。

    基于双向交互网络的行人搜索方法、系统、装置

    公开(公告)号:CN111723728A

    公开(公告)日:2020-09-29

    申请号:CN202010557984.9

    申请日:2020-06-18

    Abstract: 本发明属于计算机视觉、模式识别领域,具体涉及一种基于双向交互网络的行人搜索方法、系统、装置,旨在解决边界框外场景信息对行人特征的影响,导致行人搜索准确度较低的问题。本系统方法包括:获取输入视频中第t帧图像,作为输入图像;对输入图像进行归一化,并通过预训练的行人搜索模型获取待搜索行人目标的搜索结果;行人搜索模型基于残差网络构建,并在残差网络的分类回归层中增加新的分类层,用于获取行人目标的身份分类概率。本发明提高了行人搜索的准确度。

    基于视听多模态的舞蹈生成方法、系统、装置

    公开(公告)号:CN111711868A

    公开(公告)日:2020-09-25

    申请号:CN202010595530.0

    申请日:2020-06-24

    Abstract: 本发明属于计算机视觉、视听任务领域,具体涉及一种基于视听多模态的舞蹈生成方法、系统、装置,旨在解决现有的舞蹈生成方法忽略了骨架信息关键点之间的连接关系,导致生成的舞蹈质量较差的问题。本系统方法包括:获取音频信息序列、2D舞蹈骨架信息,将2D舞蹈骨架信息作为第一信息;将第一信息转换为图像,并结合第一信息、音频信息序列中第t帧的音频信息,通过舞蹈生成模型生成新的2D舞蹈骨架信息,作为第二信息;判断t是否等于音频信息序列的长度,若否,令t=t+1,将第二信息作为第一信息,循环生成第二信息;否则以第一信息顺次转换的图像作为舞蹈片段输出。本发明提高了舞蹈生成的质量。

    一种行人个体分割方法及装置

    公开(公告)号:CN106778705B

    公开(公告)日:2020-03-17

    申请号:CN201710065013.0

    申请日:2017-02-04

    Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。

    一种基于深度学习的聚类方法

    公开(公告)号:CN103530689B

    公开(公告)日:2016-01-20

    申请号:CN201310530626.9

    申请日:2013-10-31

    Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。

    一种基于深度学习的聚类方法

    公开(公告)号:CN103530689A

    公开(公告)日:2014-01-22

    申请号:CN201310530626.9

    申请日:2013-10-31

    Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。

    高分辨率人体图像生成方法、装置、设备及介质

    公开(公告)号:CN115953337B

    公开(公告)日:2025-02-11

    申请号:CN202210574054.3

    申请日:2022-05-24

    Abstract: 本发明提供一种高分辨率人体图像生成方法、装置、设备及介质其中方法包括:确定源人体图像和目标姿势;基于图像生成模型,应用源人体图像和目标姿势,生成目标姿势对应的低分辨率人体图像,并基于源人体图像,对低分辨率人体图像进行上采样,生成目标姿势对应的高分辨率人体图像;图像生成模型是基于样本图像对训练得到的,样本图像对包括样本目标姿势、样本源人体图像、样本目标姿势低分辨率图像和样本目标姿势高分辨率图像,该方法通过目标姿势对应的低分辨率人体图像进行有条件上采样,得到目标姿势对应的高分辨率人体图像,实现了在保证高分辨率人体图像质量的同时,降低了图像生成模型的计算量,提高了生成高分辨率人体图像的稳定性。

    高分辨率人体图像生成方法、装置、设备及介质

    公开(公告)号:CN115953337A

    公开(公告)日:2023-04-11

    申请号:CN202210574054.3

    申请日:2022-05-24

    Abstract: 本发明提供一种高分辨率人体图像生成方法、装置、设备及介质其中方法包括:确定源人体图像和目标姿势;基于图像生成模型,应用源人体图像和目标姿势,生成目标姿势对应的低分辨率人体图像,并基于源人体图像,对低分辨率人体图像进行上采样,生成目标姿势对应的高分辨率人体图像;图像生成模型是基于样本图像对训练得到的,样本图像对包括样本目标姿势、样本源人体图像、样本目标姿势低分辨率图像和样本目标姿势高分辨率图像,该方法通过目标姿势对应的低分辨率人体图像进行有条件上采样,得到目标姿势对应的高分辨率人体图像,实现了在保证高分辨率人体图像质量的同时,降低了图像生成模型的计算量,提高了生成高分辨率人体图像的稳定性。

    基于数据扰动的跨域自适应语义分割方法及装置

    公开(公告)号:CN113627433A

    公开(公告)日:2021-11-09

    申请号:CN202110680850.0

    申请日:2021-06-18

    Abstract: 本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,该方法包括,获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。

Patent Agency Ranking