可控情感语音合成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN109754779A

    公开(公告)日:2019-05-14

    申请号:CN201910033227.9

    申请日:2019-01-14

    Inventor: 陈云琳 刘冰

    Abstract: 本发明实施例公开了一种可控情感语音合成方法、装置、电子设备及可读存储介质。该可控情感语音合成方法包括:获得标准情感语音和需要注入情感的输入文本;依据所述标准情感语音获得全局的情感风格嵌入特征;将所述情感风格嵌入特征嵌入所述输入文本以获得具有情感风格的情感编码文本;将具有情感风格的情感编码文本转换为语音谱参数;通过卷积神经网络并在采样点建模的方式将所述语音谱参数合成带有情感风格的自然语音。该方法可以获得具有严厉、和蔼、甜美等不同情感风格的合成音,品质高,类似人声。

    语音转换方法、装置、设备及存储介质

    公开(公告)号:CN109637551A

    公开(公告)日:2019-04-16

    申请号:CN201811604615.X

    申请日:2018-12-26

    Inventor: 陈云琳 刘冰

    Abstract: 本公开提供了一种语音转换方法,包括:获取源说话人的预定数量的语音及目标说话人的预定数量的语音;基于所获取的源说话人的语音的特征参数及目标说话人的语音的特征参数来进行训练,以得到训练模型的转换函数;从源说话人的实时语音中提取特征参数,通过训练模型的转换函数将所提取的源说话人语音特征参数转换成目标说话人语音特征参数;以及根据转换后的目标说话人语音特征参数,得到目标说话人的语音。本公开还提供了一种语音转换装置、电子设备及可读存储介质。

    一种声频模拟方法、装置、设备及存储介质

    公开(公告)号:CN116013251A

    公开(公告)日:2023-04-25

    申请号:CN202211704212.9

    申请日:2022-12-29

    Abstract: 本公开提供了一种声频模拟方法、装置、设备及存储介质,所述方法包括:获取第一文本对应的第一音素信息,将所述第一音素级信息编码为语言表示;获取第一文本对应的第一文本信息,将所述第一文本信息编码为文本特征表示;基于语音合成模型中的声学特征和所述第一文本对应的文本特征表示,为所述第一音素级信息编码的语言表示添加声学特征,将添加了声学特征的所述第一音素级信息编码的语言表示通过解码器预测梅尔频谱进行音频输出。

    韵律模型的构建方法和装置、韵律标注方法、电子设备

    公开(公告)号:CN115470350A

    公开(公告)日:2022-12-13

    申请号:CN202211116335.0

    申请日:2022-09-14

    Abstract: 本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备和可读存储介质,该构建方法包括:获取输入数据的预测提示,其中预测提示用于指示对输入数据执行韵律标注时的韵律等级;基于预测提示,对输入数据进行韵律标注,获得具有预测提示中韵律等级的韵律标注文本;以及根据韵律标注文本与输入数据的预期标注文本之间的标注误差,对分类器进行参数调整,以获得使标注误差处于期望误差范围的韵律模型。本申请克服了对输入数据中预期标注文本的完整性的依赖,降低了输入数据的获取难度。

Patent Agency Ranking