-
公开(公告)号:CN117079638A
公开(公告)日:2023-11-17
申请号:CN202210502017.1
申请日:2022-05-10
Applicant: 中移在线服务有限公司 , 中国移动通信集团有限公司
Abstract: 本申请提供一种语音合成方法、装置、电子设备及可读存储介质。方法包括:对待合成文本的第i声学特征帧进行频带划分,得到与第i声学特征帧对应的m个子频带,每个子频带分别包括u个采样点;采用第一预测方式预测第一子频带各采样点的采样值,以及采用第二预测方式预测第二子频带各采样点的采样值,得到与第i声学特征帧对应的m×u个采样值,在第一预测方式中,采样点的采样值基于采样点的线性预测值以及激励值确定;在第二预测方式中,采样点的采样值直接基于采样点的激励值确定;根据待合成文本的各声学特征帧分别对应的m×u个采样值,生成与待合成文本对应的音频文件。本申请可以提高语音合成的速率。