-
公开(公告)号:CN111771213B
公开(公告)日:2021-10-08
申请号:CN201980013180.8
申请日:2019-02-14
Applicant: 杜比实验室特许公司
IPC: G06N3/04 , G06N3/08 , G10L13/033
Abstract: 提供用于语音合成的计算机实施方法。语音合成器可经训练以产生经合成音频数据,所述经合成音频数据对应于源说话者根据目标说话者的语音特性说出的话语。可通过带时间戳的音位序列、音调曲线数据及说话者识别数据来训练所述语音合成器。所述语音合成器可包含话音建模神经网络及调节神经网络。
-
公开(公告)号:CN111771213A
公开(公告)日:2020-10-13
申请号:CN201980013180.8
申请日:2019-02-14
Applicant: 杜比实验室特许公司
IPC: G06N3/04 , G06N3/08 , G10L13/033
Abstract: 提供用于语音合成的计算机实施方法。语音合成器可经训练以产生经合成音频数据,所述经合成音频数据对应于源说话者根据目标说话者的语音特性说出的话语。可通过带时间戳的音位序列、音调曲线数据及说话者识别数据来训练所述语音合成器。所述语音合成器可包含话音建模神经网络及调节神经网络。
-
公开(公告)号:CN114303186A
公开(公告)日:2022-04-08
申请号:CN202080058992.7
申请日:2020-08-18
Applicant: 杜比实验室特许公司
IPC: G10L13/033 , G10L21/013 , G06K9/62
Abstract: 公开了用于使用真实语音数据为新说话者适配话音克隆合成器的新方法和系统。来自一个或多个目标说话者的话语被参数化,并用于通过如下操作来初始化供话音合成器使用的嵌入向量:对话语数据进行聚类,并使用说话者识别神经网络和/或通过找到最接近于话语数据的存储嵌入矢量来确定数据的质心。
-
-