一种基于深度学习的恢复被遮挡人体姿态序列方法

    公开(公告)号:CN111738092B

    公开(公告)日:2024-03-29

    申请号:CN202010465431.0

    申请日:2020-05-28

    Abstract: 本发明公开了一种基于深度学习的恢复被遮挡人体姿态序列方法,包括以下步骤:根据视频数据进行处理,获取人体步行数据集,对人体步行数据集进行数据预处理并划分,得到前序姿态序列、目标姿态序列、后序姿态序列;训练基于RNN的第一预测模型,该模型以前序姿态序列作为输入,被遮挡姿态序列作为输出;训练基于CNN的第二预测模型,该模型使用后序姿势作为输入,被遮挡姿态序列作为输出;将第一预测模型和第二预测模型的输出进行有权重相加,并添加MergeNet网络,构建训练总模型,通过训练总模型得到最终姿态序列;本发明通过解析前序姿态序列和后续姿态序列的信息,便可恢复出人体被障碍物遮挡的运动姿态序列。

    一种核预测神经网络蒙特卡罗渲染图像去噪方法

    公开(公告)号:CN111583135B

    公开(公告)日:2023-04-07

    申请号:CN202010332918.1

    申请日:2020-04-24

    Abstract: 本发明公开了一种核预测神经网络蒙特卡罗渲染图像去噪方法,包括步骤:1)利用改进的核预测神经网络进行预测核的生成;2)利用改进的对抗生成网络进行蒙特卡罗渲染图像的初步去噪;3)利用步骤1)、2)当中的两个结果进行蒙特卡罗渲染图像的重建,预测核将会被应用到初步去噪的蒙特卡罗渲染图像当中,并重建出去噪后的蒙特卡罗渲染图像;4)使用一种新的损失函数对核预测神经网络和对抗生成网络进行训练;5)训练完成后,再次重复步骤1)到步骤3),即可对带噪声的蒙特卡罗渲染图像进行去噪重建,最后获得一张高质量的、细节完好的蒙特卡罗渲染图像。本发明去噪效果更好,场景细节和场景结构保留好,去噪时间短,可适应低采样率和多种渲染器、渲染系统。

    基于物体遮挡图结构的视频摘要方法、系统、装置及介质

    公开(公告)号:CN114693632A

    公开(公告)日:2022-07-01

    申请号:CN202210311826.4

    申请日:2022-03-28

    Inventor: 聂勇伟 曾思铭

    Abstract: 本发明公开了一种基于物体遮挡图结构的视频摘要方法、系统、装置及介质,其中方法包括:获取监控视频,根据监控视频提取管道信息,得到物体管道;根据遮挡关系将物体管道切分为管道段;在管道段之间建立边,构建图结构;解决管道段之间的位置冲突问题,完善图结构;基于图结构,采用MCMC算法对管道段进行采样,生成摘要视频。本发明根据物体管道间的遮挡关系将其分段,建立起图结构,将MCMC随机采样方法应用于根据视频内在遮挡关系分段的物体管道中,保留了其固有的逻辑,且成功解决了物体循环遮挡所形成的环引起的位置冲突问题。本发明可广泛应用于计算机图像视频处理领域。

    静态行人图像的运动动态化方法、系统、装置及介质

    公开(公告)号:CN113012268A

    公开(公告)日:2021-06-22

    申请号:CN202110245019.2

    申请日:2021-03-05

    Abstract: 本发明公开了一种静态行人图像的运动动态化方法、系统、装置及介质,其中方法包括:获取两张行人图像,根据所述行人图像提取一对人体的2D姿态;根据动作相似度将一对所述2D姿态映射到3D空间,生成一对3D姿态;根据一对所述3D姿态生成一组3D运动姿态序列;将所述3D运动姿态序列进行2D投影,获得2D运动姿态序列;根据一对所述2D姿态对所述2D运动姿态序列进行优化;根据所述行人图像和优化后的2D运动姿态序列生成行人运动图像序列。本发明通过设计动作相似度对人体姿态进行2D和3D之间的映射,能够避免数据标注的人力和时间耗费,使得人体姿态的生成更加灵活,可广泛应用于图像数据处理领域。

    一种基于深度学习的恢复被遮挡人体姿态序列方法

    公开(公告)号:CN111738092A

    公开(公告)日:2020-10-02

    申请号:CN202010465431.0

    申请日:2020-05-28

    Abstract: 本发明公开了一种基于深度学习的恢复被遮挡人体姿态序列方法,包括以下步骤:根据视频数据进行处理,获取人体步行数据集,对人体步行数据集进行数据预处理并划分,得到前序姿态序列、目标姿态序列、后序姿态序列;训练基于RNN的第一预测模型,该模型以前序姿态序列作为输入,被遮挡姿态序列作为输出;训练基于CNN的第二预测模型,该模型使用后序姿势作为输入,被遮挡姿态序列作为输出;将第一预测模型和第二预测模型的输出进行有权重相加,并添加MergeNet网络,构建训练总模型,通过训练总模型得到最终姿态序列;本发明通过解析前序姿态序列和后续姿态序列的信息,便可恢复出人体被障碍物遮挡的运动姿态序列。

    一种核预测神经网络蒙特卡罗渲染图像去噪方法

    公开(公告)号:CN111583135A

    公开(公告)日:2020-08-25

    申请号:CN202010332918.1

    申请日:2020-04-24

    Abstract: 本发明公开了一种核预测神经网络蒙特卡罗渲染图像去噪方法,包括步骤:1)利用改进的核预测神经网络进行预测核的生成;2)利用改进的对抗生成网络进行蒙特卡罗渲染图像的初步去噪;3)利用步骤1)、2)当中的两个结果进行蒙特卡罗渲染图像的重建,预测核将会被应用到初步去噪的蒙特卡罗渲染图像当中,并重建出去噪后的蒙特卡罗渲染图像;4)使用一种新的损失函数对核预测神经网络和对抗生成网络进行训练;5)训练完成后,再次重复步骤1)到步骤3),即可对带噪声的蒙特卡罗渲染图像进行去噪重建,最后获得一张高质量的、细节完好的蒙特卡罗渲染图像。本发明去噪效果更好,场景细节和场景结构保留好,去噪时间短,可适应低采样率和多种渲染器、渲染系统。

    一种基于局部稀疏表示的完全人体运动参数化表示方法

    公开(公告)号:CN110363833A

    公开(公告)日:2019-10-22

    申请号:CN201910499437.7

    申请日:2019-06-11

    Abstract: 本发明公开了一种基于局部稀疏表示的完全人体运动参数化表示方法,包括步骤:1)获取相对边长和二面角及其重构,即RLA及其重构;2)参数模型训练数据库合成;3)基于人体形状主成分分析PCA基进行形状参数提取;4)使用稀疏局部分解的方法提取出局部基;5)利用局部基表示不同身体部位的运动得到参数模型;6)对参数模型进行回归修正。本发明能够用统一的框架来描述身体姿态,脸部表情和手势的形状和动作变化,不仅可以捕获高质量的全身姿势,而且还能在关节扭转和复杂的手姿态恢复姿势时表现出优于现有技术的参数化人体模型。

    一种基于脸部轮廓分析的证件照耳朵检测与提取方法

    公开(公告)号:CN106156739B

    公开(公告)日:2019-06-18

    申请号:CN201610523793.4

    申请日:2016-07-05

    Abstract: 本发明公开了一种基于脸部轮廓分析的证件照耳朵检测与提取方法,用于自动判断证件照头像是否端正,检测证件照耳朵的有无,并最终提取证件照耳朵区域。该算法分析两种轮廓线:皮肤外轮廓和脸部轮廓,并基于如下观察:人类脸部轮廓线在一定程度上满足抛物线方程。首先提出基于皮肤外轮廓抛物线拟合的耳朵有无检测方法,用抛物线拟合皮肤外轮廓,当拟合结果较好时说明皮肤外轮廓与脸部轮廓重合,无耳朵。否则当有耳朵时,提出基于梯度和抛物线引导的动态规划算法识别脸部轮廓。脸部轮廓线能分割耳朵和脸部皮肤区域,从而实现耳朵区域的有效提取。本发明的算法能用于自拍证件照的合格性自动判断,提取出的耳朵区域可供证件照图像后处理。

    一种自然背景视频抠图方法

    公开(公告)号:CN106204567B

    公开(公告)日:2019-01-29

    申请号:CN201610525850.2

    申请日:2016-07-05

    Abstract: 本发明公开了一种自然背景视频抠图方法,包括步骤:1)关键帧自动选取,通过计算帧间差异自动地选取视频中的关键帧;2)关键帧Trimap图的生成,允许用户通过少量的手工交互提供有效信息,采用GrabCut分割算法与高斯模糊方法半自动地生成关键帧上的Trimap图;3)中间帧Trimap图的生成,利用双向光流传播生成中间各帧的Trimap图,并利用颜色、梯度等信息修正光流传播产生的误差;4)根据所有视频帧的Trimap图,以及加入三维时空优化的贝叶斯抠图算法计算出视频每一帧的α掩码图,将α掩码图与新的背景进行合成,得到新的合成视频。本发明方法具有速度快,用户交互少,最后得到的新合成视频具有良好的时间连贯性,真实感更强等优点。

    一种误差可控的细分曲面图像矢量化方法

    公开(公告)号:CN107256557A

    公开(公告)日:2017-10-17

    申请号:CN201710304102.6

    申请日:2017-05-03

    Abstract: 本发明公开了一种误差可控的细分曲面图像矢量化方法,包括如下步骤:1)检测图像边缘特征,得到一个像素宽的初始图像特征线段;2)构造基于图像特征的初始网格,并在网格中标记图像特征;3)简化初始网格,构造保持图像特征的基网格;4)误差可控的Loop细分曲面拟合求得控制网格;5)光栅化矢量表示。给定一张光栅图像,本发明能够得到较好的矢量图像,如果初始重构结果的误差不能满足用户需求,本发明可以衡量出矢量化的重构图像与原图像误差,通过对基网格进行自适应细分以达到一定范围内的指定误差,做到误差可控。本发明研究使用细分曲面技术进行图像矢量化,目的是将光栅图像转换为满足误差要求的矢量表示,具有实际应用价值。

Patent Agency Ranking