-
公开(公告)号:CN103310784A
公开(公告)日:2013-09-18
申请号:CN201310081220.7
申请日:2013-03-14
Applicant: 株式会社东芝
IPC: G10L13/027 , G10L13/04
CPC classification number: G10L15/26 , G10L13/033 , G10L13/08 , G10L2021/0135
Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。
-
公开(公告)号:CN103310784B
公开(公告)日:2015-11-04
申请号:CN201310081220.7
申请日:2013-03-14
Applicant: 株式会社东芝
IPC: G10L13/027 , G10L13/04
CPC classification number: G10L15/26 , G10L13/033 , G10L13/08 , G10L2021/0135
Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。
-
公开(公告)号:CN103366733A
公开(公告)日:2013-10-23
申请号:CN201310110148.6
申请日:2013-04-01
Applicant: 株式会社东芝
IPC: G10L13/08
CPC classification number: G10L13/08 , G10L13/033 , G10L2021/0135
Abstract: 一种文本到语音的方法,其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音,该方法包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的说话者;选择用于所输入的文本的说话者属性;使用声学模型,将声学单元序列转换成语音向量序列;输出语音向量序列,作为具有所选择的说话者声音和所选择的说话者属性的音频,其中,所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数,第一组和第二组参数没有重叠,选择说话者声音包括从第一组参数中选择给出说话者声音的参数,选择说话者属性包括从第二组参数中选择给出所选择的说话者属性的参数。
-
-