语音生成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN113628608A

    公开(公告)日:2021-11-09

    申请号:CN202010415450.2

    申请日:2020-05-15

    Abstract: 本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升了语音合成的效果。

    语音合成模型的训练方法和语音合成方法

    公开(公告)号:CN114387946A

    公开(公告)日:2022-04-22

    申请号:CN202011128918.6

    申请日:2020-10-20

    Abstract: 本申请提供语音合成模型的训练方法和语音合成方法,模型包括文本编码模块、文本解码模块和第一预测编码模块;训练方法包括:获取训练数据集;训练数据集包括发音对象的语音数据,以及与语音数据对应的文本数据;通过文本编码模块,基于文本数据,得到音素编码序列;通过第一预测编码模块,基于语音数据,得到第一音素隐含表示;通过文本解码模块,基于音素编码序列、第一音素隐含表示和发音对象嵌入、情感嵌入,得到语音合成数据;基于语音数据与语音合成数据更新语音合成模型。本申请的实施可有效提高发音对象所对应情感语音的自然度和情感表现力。

Patent Agency Ranking