-
公开(公告)号:CN115470351A
公开(公告)日:2022-12-13
申请号:CN202211117014.2
申请日:2022-09-14
Applicant: 出门问问信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G10L13/10
Abstract: 本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备,包括:获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本,其中输入数据的韵律等级高于各个前序分类器对应的韵律等级;基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器;以及整合各个前序分类器和目标分类器,获得韵律模型。
-
公开(公告)号:CN115547289A
公开(公告)日:2022-12-30
申请号:CN202211142609.3
申请日:2022-09-20
Applicant: 出门问问信息科技有限公司
Abstract: 本公开提供了一种语音合成方法、装置、电子设备及存储介质,所述方法包括:确定用于语音合成的原始语料;从所述原始语料中提取文本对话表现力,所述文本对话表现力包括对话意向和对话风格;基于所述文本对话表现力确定文本对话风格特征;将所述文本对话风格特征输入至语音合成模型,基于所述语音合成模型输出的梅尔频谱,确定所述原始语料对应的对话语音。
-
公开(公告)号:CN109754779A
公开(公告)日:2019-05-14
申请号:CN201910033227.9
申请日:2019-01-14
Applicant: 出门问问信息科技有限公司
IPC: G10L13/033 , G10L13/10 , G10L19/00
Abstract: 本发明实施例公开了一种可控情感语音合成方法、装置、电子设备及可读存储介质。该可控情感语音合成方法包括:获得标准情感语音和需要注入情感的输入文本;依据所述标准情感语音获得全局的情感风格嵌入特征;将所述情感风格嵌入特征嵌入所述输入文本以获得具有情感风格的情感编码文本;将具有情感风格的情感编码文本转换为语音谱参数;通过卷积神经网络并在采样点建模的方式将所述语音谱参数合成带有情感风格的自然语音。该方法可以获得具有严厉、和蔼、甜美等不同情感风格的合成音,品质高,类似人声。
-
公开(公告)号:CN109637551A
公开(公告)日:2019-04-16
申请号:CN201811604615.X
申请日:2018-12-26
Applicant: 出门问问信息科技有限公司
IPC: G10L21/007 , G10L21/01 , G10L21/013 , G10L25/30 , G06N3/08 , G06N3/04
Abstract: 本公开提供了一种语音转换方法,包括:获取源说话人的预定数量的语音及目标说话人的预定数量的语音;基于所获取的源说话人的语音的特征参数及目标说话人的语音的特征参数来进行训练,以得到训练模型的转换函数;从源说话人的实时语音中提取特征参数,通过训练模型的转换函数将所提取的源说话人语音特征参数转换成目标说话人语音特征参数;以及根据转换后的目标说话人语音特征参数,得到目标说话人的语音。本公开还提供了一种语音转换装置、电子设备及可读存储介质。
-
公开(公告)号:CN116013251A
公开(公告)日:2023-04-25
申请号:CN202211704212.9
申请日:2022-12-29
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/047 , G10L13/04 , G10L25/30
Abstract: 本公开提供了一种声频模拟方法、装置、设备及存储介质,所述方法包括:获取第一文本对应的第一音素信息,将所述第一音素级信息编码为语言表示;获取第一文本对应的第一文本信息,将所述第一文本信息编码为文本特征表示;基于语音合成模型中的声学特征和所述第一文本对应的文本特征表示,为所述第一音素级信息编码的语言表示添加声学特征,将添加了声学特征的所述第一音素级信息编码的语言表示通过解码器预测梅尔频谱进行音频输出。
-
公开(公告)号:CN115470350A
公开(公告)日:2022-12-13
申请号:CN202211116335.0
申请日:2022-09-14
Applicant: 出门问问信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G10L13/10
Abstract: 本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备和可读存储介质,该构建方法包括:获取输入数据的预测提示,其中预测提示用于指示对输入数据执行韵律标注时的韵律等级;基于预测提示,对输入数据进行韵律标注,获得具有预测提示中韵律等级的韵律标注文本;以及根据韵律标注文本与输入数据的预期标注文本之间的标注误差,对分类器进行参数调整,以获得使标注误差处于期望误差范围的韵律模型。本申请克服了对输入数据中预期标注文本的完整性的依赖,降低了输入数据的获取难度。
-
-
-
-
-