-
公开(公告)号:CN108364632B
公开(公告)日:2021-09-10
申请号:CN201711407738.X
申请日:2017-12-22
Applicant: 东南大学
IPC: G10L13/02 , G06F40/289
Abstract: 本发明公开一种具备情感的中文文本人声合成方法,主要包括,(1)构建情感语料库;(2)基于波形拼接的带情感语音合成。建立语料库的主要步骤为:(11)分词并获取词语的词性;(12)语音切分,基于语音数据特征与文本语料获取对应分词的音频数据;(13)情感分析,基于文本分词与音频特征获取词语、短句和整句的情感特征值。基于波形拼接的带情感语音合成步骤为:(21)分词和情感分析,对待合成文本进行分词和情感分析,获取待合成文本内的词语词性、句型和情感特征;(32)选取最优语料,基于文本特征值匹配出最优语料集;(23)语音合成,波形拼接,从语料集中提取出词语音频序列集,将音频拼接合成输出最终语音。本发明合成输出具有情感特征的真人声语音。
-
公开(公告)号:CN108364632A
公开(公告)日:2018-08-03
申请号:CN201711407738.X
申请日:2017-12-22
Applicant: 东南大学
Abstract: 本发明公开一种具备情感的中文文本人声合成方法,主要包括,(1)构建情感语料库;(2)基于波形拼接的带情感语音合成。建立语料库的主要步骤为:(11)分词并获取词语的词性;(12)语音切分,基于语音数据特征与文本语料获取对应分词的音频数据;(13)情感分析,基于文本分词与音频特征获取词语、短句和整句的情感特征值。基于波形拼接的带情感语音合成步骤为:(21)分词和情感分析,对待合成文本进行分词和情感分析,获取待合成文本内的词语词性、句型和情感特征;(32)选取最优语料,基于文本特征值匹配出最优语料集;(23)语音合成,波形拼接,从语料集中提取出词语音频序列集,将音频拼接合成输出最终语音。本发明合成输出具有情感特征的真人声语音。
-