-
公开(公告)号:CN118540424A
公开(公告)日:2024-08-23
申请号:CN202310573175.0
申请日:2023-05-19
Applicant: 华为云计算技术有限公司
IPC: H04N5/265 , H04N21/439 , H04N21/44 , H04N21/43 , G10L15/04 , G10L15/06 , G06V10/774 , G10L25/30 , G06N20/00 , H04N21/845
Abstract: 本公开提供了一种数字人生成模型的训练方法、装置和计算设备集群,属于机器学习技术领域。方法应用于云平台,方法包括:将音频和真人图像输入数字人生成模型,得到所述真人图像对应的数字人说话图像;在所述音频中,确定与所述数字人说话图像中的数字人口型不匹配的音素;获取包含所述音素的真人说话视频;基于所述真人说话视频,对所述数字人生成模型进行训练。采用本公开,可以提高数字人生成模型的训练效果。