-
公开(公告)号:CN101452701A
公开(公告)日:2009-06-10
申请号:CN200710194139.4
申请日:2007-12-05
Applicant: 株式会社东芝
Inventor: 何磊
Abstract: 本发明提供一种训练与音素相关的反模型的方法和装置、生成用于基于反模型的置信度估计的权重的方法和装置、用于语音识别结果的基于反模型的置信度估计方法和装置、语音识别方法和系统,其中训练与音素相关的反模型的方法包括:以音素为声学基元识别训练语音,以得到训练语音的识别结果;分析识别结果中的各个音素之间的混淆度;对于识别结果中的每一个音素,选择易于与该音素混淆的至少一个竞争性音素;建立第一反模型和第二反模型;利用与上述至少一个竞争性音素对应的训练语音段,训练第一反模型;利用与除了上述至少一个竞争性音素之外的音素对应的训练语音段,训练第二反模型。
-
公开(公告)号:CN101089952A
公开(公告)日:2007-12-19
申请号:CN200610092246.1
申请日:2006-06-15
Applicant: 株式会社东芝
CPC classification number: G10L15/20 , G10L15/02 , G10L21/0208
Abstract: 本发明提供了噪声抑制方法,平滑语音谱的方法,提取语音特征的方法,语音识别方法及训练语音模型的方法和装置。本发明的噪声抑制方法通过最小均方误差估计进行,其中采用分段线性函数来近似合流超几何函数,从而能够极大的减少计算量,同时保持抑制噪声性能。此外,本发明为了避免产生能量极低的语音谱成分,在最小均方误差估计之后利用几何数列权重对语音谱在时间轴和频率轴进行平滑。此外,本发明通过调整先验SNR来控制噪声抑制和语音失真之间的平衡。
-
公开(公告)号:CN101051464A
公开(公告)日:2007-10-10
申请号:CN200610073144.5
申请日:2006-04-06
Applicant: 株式会社东芝
CPC classification number: G10L17/04
Abstract: 本发明提供了说话人认证的注册方法和装置、说话人认证的验证方法和装置以及说话人认证系统。该说话人认证的注册方法包括:根据说话人的注册语音,提取语音特征向量序列;以及利用上述语音特征向量序列,生成说话人模板;其中,上述提取语音特征向量序列的步骤包括:利用上述说话人的注册语音,生成针对该注册语音的滤波器组,用于滤出该注册语音的频谱中的共振峰位置和能量;利用上述生成的滤波器组,对该注册语音的频谱进行滤波;以及根据滤波后的上述注册语音,生成特征向量序列。
-
-