-
公开(公告)号:CN115547293A
公开(公告)日:2022-12-30
申请号:CN202211178621.X
申请日:2022-09-27
Applicant: 杭州电子科技大学
IPC: G10L13/027 , G10L13/08 , G10L13/10 , G10L25/30
Abstract: 本发明公开了一种基于分层韵律预测的多语言语音合成方法,包括如下步骤:S1、制作训练集,获取不同说话人的多语言标准参考音频及对应的样本文本,对其进行预处理得到训练样本,并制作成训练集;S2、构建并训练语音合成模型,通过预处理后的训练集对构建的语音合成模型进行训练;S3、语音合成,训练好后的语音合成模型根据输入的待合成文本和参考音频生成指定声音风格的多语言语音,经由声码器输出。以在多语言穿插使用的场景下更有效地提取文本和参考音频中的韵律特征,提升合成语音韵律的灵活度和可控性,细粒度调控韵律以提高合成语音的自然度,并实现复制任一说话人声音、迁移任一说话风格的功能。