文本到语音的方法和系统

    公开(公告)号:CN103310784B

    公开(公告)日:2015-11-04

    申请号:CN201310081220.7

    申请日:2013-03-14

    CPC classification number: G10L15/26 G10L13/033 G10L13/08 G10L2021/0135

    Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。

    文本到语音的方法和系统

    公开(公告)号:CN103310784A

    公开(公告)日:2013-09-18

    申请号:CN201310081220.7

    申请日:2013-03-14

    CPC classification number: G10L15/26 G10L13/033 G10L13/08 G10L2021/0135

    Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。

Patent Agency Ranking