语音合成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117079638A

    公开(公告)日:2023-11-17

    申请号:CN202210502017.1

    申请日:2022-05-10

    Abstract: 本申请提供一种语音合成方法、装置、电子设备及可读存储介质。方法包括:对待合成文本的第i声学特征帧进行频带划分,得到与第i声学特征帧对应的m个子频带,每个子频带分别包括u个采样点;采用第一预测方式预测第一子频带各采样点的采样值,以及采用第二预测方式预测第二子频带各采样点的采样值,得到与第i声学特征帧对应的m×u个采样值,在第一预测方式中,采样点的采样值基于采样点的线性预测值以及激励值确定;在第二预测方式中,采样点的采样值直接基于采样点的激励值确定;根据待合成文本的各声学特征帧分别对应的m×u个采样值,生成与待合成文本对应的音频文件。本申请可以提高语音合成的速率。

Patent Agency Ranking