-
公开(公告)号:CN112687262A
公开(公告)日:2021-04-20
申请号:CN201910989983.9
申请日:2019-10-17
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种语音转换方法、装置、电子设备及计算机可读存储介质,涉及信号处理技术领域。该方法包括:获取待转换的源语音;基于预设的训练后的transformer转换网络对源语音进行转换,得到目标转换语音;目标转换语音的语音内容与源语音的语音内容相同。本申请实施例提供的transformer转换网络更容易的学习长时依赖,使得转换后句子整体的韵律合适,输入的目标转换语音更自然。
-
公开(公告)号:CN113628608A
公开(公告)日:2021-11-09
申请号:CN202010415450.2
申请日:2020-05-15
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升了语音合成的效果。
-
公开(公告)号:CN115512684A
公开(公告)日:2022-12-23
申请号:CN202110696106.X
申请日:2021-06-23
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L13/04 , G10L13/033 , G10L25/48
Abstract: 提供一种音频处理模型的训练方法及装置、音频处理方法及装置。该音频处理模型的训练方法包括:对训练数据进行特征提取,得到训练数据的特征;基于训练数据的特征预测训练数据的颤音程度,得到训练数据的预测颤音程度;基于训练数据的预测颤音程度预测训练数据的基频,得到训练数据的预测基频;基于训练数据的预测颤音程度和预测基频以及训练数据的真实颤音程度和真实基频对音频处理模型进行训练。该音频处理方法包括:提取音频数据的特征;基于音频数据的特征预测音频数据的颤音程度;基于音频数据的颤音程度预测音频数据的基频;基于音频数据的基频对音频数据进行处理。通过使用该音频处理方法及装置,可提高音频处理的效果。
-
公开(公告)号:CN114387946A
公开(公告)日:2022-04-22
申请号:CN202011128918.6
申请日:2020-10-20
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L13/027 , G10L25/30
Abstract: 本申请提供语音合成模型的训练方法和语音合成方法,模型包括文本编码模块、文本解码模块和第一预测编码模块;训练方法包括:获取训练数据集;训练数据集包括发音对象的语音数据,以及与语音数据对应的文本数据;通过文本编码模块,基于文本数据,得到音素编码序列;通过第一预测编码模块,基于语音数据,得到第一音素隐含表示;通过文本解码模块,基于音素编码序列、第一音素隐含表示和发音对象嵌入、情感嵌入,得到语音合成数据;基于语音数据与语音合成数据更新语音合成模型。本申请的实施可有效提高发音对象所对应情感语音的自然度和情感表现力。
-
-
-