-
公开(公告)号:CN119991888A
公开(公告)日:2025-05-13
申请号:CN202510457933.1
申请日:2025-04-14
Applicant: 南京信息工程大学
IPC: G06T13/20 , G06T13/40 , G06T15/20 , G06T9/00 , G06N3/0499 , G06N3/084 , G06N3/045 , G06N3/094 , G06N3/0464
Abstract: 本发明公开了一种基于3DGS的高保真语音驱动数字人合成方法,首先,训练静态数字人模型,基于3D Gaussian Splatting构建,并用空间判别器提升图像质量,捕捉数字人基础形状和外观。随后,训练动态驱动网络,包含可优化全局提示、渐进式条件属性预测网络模块和双重判别器架构,其中,可优化全局提示模块用于稳定数字人面部几何结构,防止动画过程中的漂移;渐进式条件属性预测网络模块用于高效且时序连贯地预测数字人模型的动态高斯参数;双判别器架构模块用于提升合成数字人动画的真实感和时间一致性。本发明适用于语音驱动的数字人动画合成,能够有效提升合成数字人动画的真实感、效率和结构连贯性,并实现实时渲染。