-
公开(公告)号:CN116013251A
公开(公告)日:2023-04-25
申请号:CN202211704212.9
申请日:2022-12-29
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/047 , G10L13/04 , G10L25/30
Abstract: 本公开提供了一种声频模拟方法、装置、设备及存储介质,所述方法包括:获取第一文本对应的第一音素信息,将所述第一音素级信息编码为语言表示;获取第一文本对应的第一文本信息,将所述第一文本信息编码为文本特征表示;基于语音合成模型中的声学特征和所述第一文本对应的文本特征表示,为所述第一音素级信息编码的语言表示添加声学特征,将添加了声学特征的所述第一音素级信息编码的语言表示通过解码器预测梅尔频谱进行音频输出。