-
公开(公告)号:CN117558047A
公开(公告)日:2024-02-13
申请号:CN202311503023.X
申请日:2023-11-10
Applicant: 深圳市腾讯计算机系统有限公司 , 南京大学
IPC: G06V40/16 , G06V40/70 , G06V10/774 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/0895 , G10L21/055 , G10L25/30 , G10L13/02
Abstract: 本申请提供了一种模型训练方法、视频生成方法、装置、设备以及存储介质,该方法包括:采集说话人脸视频数据集和音频数据集,说话人脸视频数据集包括多个人的说话人脸视频数据,每个人的说话人脸视频数据包括每个人在多视角下的多帧说话人脸图像,音频数据集包括多个人的音频数据;对每个人的说话人脸图像进行特征提取得到每个人的说话人脸图像对应的目标身份特征向量,以及对每个人的音频数据进行特征提取得到每个人的音频数据对应的目标音频特征向量;利用每个人的说话人脸图像对应的目标身份特征向量和每个人的音频数据对应的目标音频特征向量,对神经辐射场模型和超分网络进行联合训练,其中,神经辐射场模型的输出作为超分网络的输入。
-
公开(公告)号:CN114494576B
公开(公告)日:2025-02-07
申请号:CN202111595948.2
申请日:2021-12-23
Applicant: 南京大学
IPC: G06T17/00 , G06N3/0499 , G06N3/084 , G06N3/0985 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于隐函数的快速高精度多视点人脸三维重建方法,属于计算机视觉领域。该方法包括:获取多视点人脸数据;使用人脸参数化模型生成初始的人脸模板,将人脸模板展开成平面构建解空间;采用隐函数表示人脸表面,构建基于隐函数的人脸表面预测网络;构建解空间正则化网络;根据多视点图片生成预测人脸模型的纹理;构建置换贴图预测网络;训练网络,通过输入的多视点图片预测高精度的人脸三维模型。利用本发明方法重建的人脸三维模型,具有很高的精度,保留了脸部毛孔级的细节信息,同时具有重建速度快的优势。
-
公开(公告)号:CN109035416A
公开(公告)日:2018-12-18
申请号:CN201810763717.X
申请日:2018-07-12
Applicant: 南京大学
CPC classification number: G06T19/006 , G09B9/00
Abstract: 本发明公开了一种基于Unity 3D技术的森林火灾消防虚拟仿真系统构建方法,以现实中消防员、灭火器材和森林场景数据为依据以1:1比例建立三维模型,设计控制火势、烟雾动态变化的算法,并利用此算法对森林火势进行动态控制,为增加虚拟仿真系统的交互性与可重复性,评分系统针对每次不同的森林火灾场景以及消防灭火的过程,给出相应的评价。本发明能够使得消防员在虚拟的环境中,较为真实地感受森林火灾现场的发展以及消防灭火的动态过程,在节约成本的前提下,训练消防员的专业技能。
-
公开(公告)号:CN114494576A
公开(公告)日:2022-05-13
申请号:CN202111595948.2
申请日:2021-12-23
Applicant: 南京大学
Abstract: 本发明公开了一种基于隐函数的快速高精度多视点人脸三维重建方法,属于计算机视觉领域。该方法包括:获取多视点人脸数据;使用人脸参数化模型生成初始的人脸模板,将人脸模板展开成平面构建解空间;采用隐函数表示人脸表面,构建基于隐函数的人脸表面预测网络;构建解空间正则化网络;根据多视点图片生成预测人脸模型的纹理;构建置换贴图预测网络;训练网络,通过输入的多视点图片预测高精度的人脸三维模型。利用本发明方法重建的人脸三维模型,具有很高的精度,保留了脸部毛孔级的细节信息,同时具有重建速度快的优势。
-
-
-