-
公开(公告)号:CN106486114A
公开(公告)日:2017-03-08
申请号:CN201510542215.0
申请日:2015-08-28
Applicant: 株式会社东芝
Abstract: 本发明提供一种改进语音识别系统的语言模型的方法和装置、以及语音识别方法和装置。改进语音识别系统的语言模型的装置包括:提取单元,其从用户提供的用户文档中提取用户词汇;分类单元,其基于上述语音识别系统的系统词典对上述用户词汇进行分类;和设定单元,其基于分类的结果对上述用户词汇的至少一个设定语言模型概率的加权因子。
-
公开(公告)号:CN104951469A
公开(公告)日:2015-09-30
申请号:CN201410124005.5
申请日:2014-03-28
Applicant: 株式会社东芝
Abstract: 本发明提供优化语料库的方法以及优化语料库的装置。本发明的一个实施方式的优化语料库的装置,包括:过滤单元,其基于优化参数对上述语料库中的句子对进行过滤,得到待优化的句子对;替换单元,其对上述待优化的句子对的至少一部分进行替换;以及困惑度计算单元,其计算替换后的句子对的困惑度,在上述替换后的句子对的困惑度小于上述待优化的句子对的困惑度的情况下,将上述替换后的句子对作为上述待优化的句子对的优化结果。
-
公开(公告)号:CN101271687B
公开(公告)日:2012-07-18
申请号:CN200710089176.9
申请日:2007-03-20
Applicant: 株式会社东芝
Abstract: 本发明提供了数据驱动训练字音转换概率预测模型、构建字音转换概率预测模型、字音转换预测以及语音合成的方法和装置。本发明的数据驱动训练字音转换概率预测模型的方法包括:利用与字音转换预测相关的多个属性和至少一部分上述属性的组合生成初始字音转换概率预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述字音转换概率预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成字音转换概率预测模型;判断上述重新生成的字音转换概率预测模型是否最优;以及如果上述字音转换概率预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。
-
公开(公告)号:CN101089952B
公开(公告)日:2010-10-06
申请号:CN200610092246.1
申请日:2006-06-15
Applicant: 株式会社东芝
CPC classification number: G10L15/20 , G10L15/02 , G10L21/0208
Abstract: 本发明提供了噪声抑制方法,平滑语音谱的方法,提取语音特征的方法,语音识别方法及训练语音模型的方法和装置。本发明的噪声抑制方法通过最小均方误差估计进行,其中采用分段线性函数来近似合流超几何函数,从而能够极大的减少计算量,同时保持抑制噪声性能。此外,本发明为了避免产生能量极低的语音谱成分,在最小均方误差估计之后利用几何数列权重对语音谱在时间轴和频率轴进行平滑。此外,本发明通过调整先验SNR来控制噪声抑制和语音失真之间的平衡。
-
公开(公告)号:CN1953052B
公开(公告)日:2010-09-08
申请号:CN200510114320.0
申请日:2005-10-20
Applicant: 株式会社东芝
CPC classification number: G10L13/10 , G10L15/148
Abstract: 本发明提供了数据驱动训练时长预测模型的方法和装置、时长预测方法和装置以及语音合成方法和装置。本发明的数据驱动训练时长预测模型的方法,包括:利用与时长预测相关的多个属性和至少一部分上述属性的组合生成初始时长预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述时长预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成时长预测模型;判断上述重新生成的时长预测模型是否最优;以及如果上述时长预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。
-
公开(公告)号:CN101271687A
公开(公告)日:2008-09-24
申请号:CN200710089176.9
申请日:2007-03-20
Applicant: 株式会社东芝
Abstract: 本发明提供了数据驱动训练字音转换概率预测模型、构建字音转换概率预测模型、字音转换预测以及语音合成的方法和装置。本发明的数据驱动训练字音转换概率预测模型的方法包括:利用与字音转换预测相关的多个属性和至少一部分上述属性的组合生成初始字音转换概率预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述字音转换概率预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成字音转换概率预测模型;判断上述重新生成的字音转换概率预测模型是否最优;以及如果上述字音转换概率预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。
-
公开(公告)号:CN101051459A
公开(公告)日:2007-10-10
申请号:CN200610073145.X
申请日:2006-04-06
Applicant: 株式会社东芝
CPC classification number: G10L13/10
Abstract: 本发明提供了数据驱动训练基频和停顿预测模型、基频和停顿预测以及语音合成方法和装置。本发明的数据驱动训练基频预测模型的方法包括:用正交多项式表示基频;对于上述正交多项式的每一个参数,利用与基频预测相关的多个属性和至少一部分上述属性的组合生成一个初始参数预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述参数预测模型的每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成参数预测模型;判断上述重新生成的参数预测模型是否最优;以及如果上述参数预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中,上述正交多项式及其全部参数预测模型构成基频预测模型。
-
公开(公告)号:CN1953052A
公开(公告)日:2007-04-25
申请号:CN200510114320.0
申请日:2005-10-20
Applicant: 株式会社东芝
CPC classification number: G10L13/10 , G10L15/148
Abstract: 本发明提供了数据驱动训练时长预测模型的方法和装置、时长预测方法和装置以及语音合成方法和装置。本发明的数据驱动训练时长预测模型的方法,包括:利用与时长预测相关的多个属性和至少一部分上述属性的组合生成初始时长预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述时长预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成时长预测模型;判断上述重新生成的时长预测模型是否最优;以及如果上述时长预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。
-
公开(公告)号:CN104750687A
公开(公告)日:2015-07-01
申请号:CN201310728270.X
申请日:2013-12-25
Applicant: 株式会社东芝
CPC classification number: G06F17/2827
Abstract: 本发明的实施方式提供了用于改进双语语料库的方法、用于改进双语语料库的装置、机器翻译方法以及机器翻译装置。根据本发明的一个方面,提供了一种用于改进双语语料库的装置,其中,上述双语语料库包括多个第一语种和第二语种的句对以及每个句对之间的词对齐信息,上述装置包括:提取单元,其在给定的句对的词对齐信息中提取切分候选;计算单元,其计算上述切分候选的切分置信度;比较单元,其对上述切分置信度和预定的阈值进行比较;以及切分单元,其在上述切分置信度大于等于上述阈值的情况下,在上述切分候选处对上述给定的句对进行切分。
-
公开(公告)号:CN100552664C
公开(公告)日:2009-10-21
申请号:CN200610135658.9
申请日:2006-10-20
Abstract: 本发明提供一种模式匹配装置以及方法,其中模式匹配装置针对构成标准模式的各特征要素,通过将与邻接的特征要素近似的特征要素合并成一个特征要素,来压缩标准模式。另外,生成压缩后的压缩标准模式B′x的每个特征要素的压缩比的序列作为压缩信息Nx。然后,将压缩后的压缩标准模式B′x与针对该压缩标准模式B′x生成的压缩信息Nx相关联地存储,模式匹配处理单元(15)在输入了输入模式A后,由复原单元(21)根据与该压缩标准模式B′x相关联的压缩信息Nx,把压缩标准模式B′x伸长,将其复原成标准模式。然后,距离计算单元(23)利用动态规划法计算复原后的标准模式与输入模式A的模式间距离。
-
-
-
-
-
-
-
-
-