-
公开(公告)号:CN103578462A
公开(公告)日:2014-02-12
申请号:CN201310301682.5
申请日:2013-07-18
Applicant: 株式会社东芝
IPC: G10L13/08
Abstract: 一种文语转换方法,该方法包括:接收输入文本;将所述输入文本分割为声单元序列;利用声学模型将所述声单元序列转换为语音矢量序列,其中所述模型具有多个模型参数,模型参数描述将声单元与语音矢量相关联的概率分布;以及将所述语音矢量序列输出为音频,该方法还包括通过如下步骤确定所述模型参数的至少部分:从所述输入文本提取表达特征以形成在第一空间中构建的表达语言特征矢量;以及将所述表达语言特征矢量映射到在第二空间中构建的表达合成特征矢量。
-
公开(公告)号:CN101051461A
公开(公告)日:2007-10-10
申请号:CN200710088572.X
申请日:2007-03-16
Applicant: 株式会社东芝
IPC: G10L15/20
CPC classification number: G10L15/20 , G10L15/02 , G10L15/065
Abstract: 本发明提供一种特征向量补偿装置和特征向量补偿方法。其中,特征提取单元提取输入语音的特征向量。相似性计算单元根据特征向量,针对多个噪声环境中的每一个计算相似度。补偿向量计算单元从存储单元中获取第一补偿向量,根据第一补偿向量计算第二补偿向量,并且通过以相似度作为加权系数使第二补偿向量加权相加,来计算第三补偿向量。补偿单元根据第三补偿向量来补偿特征向量。
-
-
公开(公告)号:CN1300018A
公开(公告)日:2001-06-20
申请号:CN00128501.7
申请日:2000-09-30
Applicant: 株式会社东芝
CPC classification number: G10L13/00
Abstract: 本发明提供一种与阅读纸上铅字的情形一样可以方便使用的书籍朗读电子机器,一种安装了可自由装卸的存储了铅字型书籍数据的卡型记录媒体的半导体存储媒体卡的电子机器,具有:以上述半导体存储媒体卡中的书籍数据为基础进行声音合成的声音合成部;取出在上述声音合成部得到的合成声音的合成声音取出部。这里,声音合成实现了用中间语言数据S的优质声音合成。而且,还有进行铅字显示的书籍数据显示部,与上述合成声音的取出同步,在上述书籍数据显示部进行上述书籍数据的铅字显示。
-
公开(公告)号:CN111159364B
公开(公告)日:2023-10-03
申请号:CN201910811007.4
申请日:2019-08-30
Applicant: 株式会社东芝
IPC: G06F16/332
Abstract: 本发明涉及对话系统、对话装置、对话方法及存储介质。提供当在用户的提问中包含未知的关键词时也能输出与用户的交互继续的响应的对话系统、对话装置、对话方法及存储介质。一个实施方式的对话系统具备知识参照部、未知关键词检测部、关联关键词推测部及响应生成部。知识参照部通过利用输入句的解析结果参照提问响应知识,得到针对输入句的回答的候补。未知关键词检测部从输入句检测未知关键词。关联关键词推测部响应于检测到未知关键词,从预定的关键词获取具有与未知关键词接近的意思的关联关键词的候补。响应生成部在未检测到未知关键词时根据回答的候补生成针对输入句的响应,在检测到未知关键词时根据关联关键词的候补生成针对输入句的响应。
-
公开(公告)号:CN103310784A
公开(公告)日:2013-09-18
申请号:CN201310081220.7
申请日:2013-03-14
Applicant: 株式会社东芝
IPC: G10L13/027 , G10L13/04
CPC classification number: G10L15/26 , G10L13/033 , G10L13/08 , G10L2021/0135
Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。
-
-
公开(公告)号:CN103310784B
公开(公告)日:2015-11-04
申请号:CN201310081220.7
申请日:2013-03-14
Applicant: 株式会社东芝
IPC: G10L13/027 , G10L13/04
CPC classification number: G10L15/26 , G10L13/033 , G10L13/08 , G10L2021/0135
Abstract: 一种文本到语音的方法,用于模拟多个不同的声音特性,包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的声音特性;使用声学模型,将声学单元序列转换成语音向量序列,其中模型具有多个模型参数,其描述将声学单元与语音向量有关的概率分布;输出语音向量序列,作为具有所选择的声音特性的音频;其中,在所选择的声音特性中每个概率分布的预定类型的参数被表示为相同类型的参数的加权和,其中,所使用的权重是依赖声音特性的,以使得将声学单元序列转换成语音向量序列包括获取用于所选择的声音特性的声音特性依赖权重,其中,参数在聚类中提供,每个聚类包括至少一个子聚类,其中对于每个聚类,获取声音特性依赖权重,以使得每个子聚类有一个权重。
-
公开(公告)号:CN103366733A
公开(公告)日:2013-10-23
申请号:CN201310110148.6
申请日:2013-04-01
Applicant: 株式会社东芝
IPC: G10L13/08
CPC classification number: G10L13/08 , G10L13/033 , G10L2021/0135
Abstract: 一种文本到语音的方法,其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音,该方法包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的说话者;选择用于所输入的文本的说话者属性;使用声学模型,将声学单元序列转换成语音向量序列;输出语音向量序列,作为具有所选择的说话者声音和所选择的说话者属性的音频,其中,所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数,第一组和第二组参数没有重叠,选择说话者声音包括从第一组参数中选择给出说话者声音的参数,选择说话者属性包括从第二组参数中选择给出所选择的说话者属性的参数。
-
公开(公告)号:CN101051462A
公开(公告)日:2007-10-10
申请号:CN200710091473.7
申请日:2007-03-30
Applicant: 株式会社东芝
CPC classification number: G10L15/20
Abstract: 噪声环境存储单元,在其中存储用于补偿语音的特征矢量的补偿矢量。特征提取单元,在多个帧中的每个帧中提取语音的特征矢量。噪声环境序列估计单元,根据特征矢量序列和相似性程度估计噪声环境序列。计算单元,根据在噪声环境存储单元内存在的补偿矢量获得与在估计的噪声环境序列内的每个噪声环境对应的补偿矢量。补偿单元根据所获得的补偿矢量补偿语音的所提取特征矢量。
-
-
-
-
-
-
-
-
-