-
公开(公告)号:CN101794577B
公开(公告)日:2012-10-03
申请号:CN201010108535.2
申请日:2010-01-29
Applicant: 株式会社NTT都科摩
IPC: G10L15/28
CPC classification number: H04M3/42153 , G10L15/183 , G10L15/30 , G10L2015/228 , H04M2201/40 , H04M2201/405 , H04M2250/66
Abstract: 本发明提供声音识别服务器、电话机、声音识别系统以及声音识别方法。声音识别服务器(200)具备:声音接收部(202),其接收来自电话机(100)的声音;模型存储部(208),其存储用于将声音接收部(202)所接收的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;号码判定部(204),其判定电话机(100)的当前呼出号码以及其它号码;模型选择部(206),其根据当前呼出号码以及其它号码选择模型存储部(208)中存储的声学模型,且根据当前呼出号码选择模型存储部(208)中存储的语言模型;和声音识别部(210),其根据模型选择部(206)所选择的声学模型以及语言模型,将声音接收部(202)所接收的声音转换为字符。
-
公开(公告)号:CN101567189B
公开(公告)日:2012-04-25
申请号:CN200910135059.0
申请日:2009-04-22
Applicant: 株式会社NTT都科摩
Abstract: 本发明提供声音识别结果修正装置、方法以及系统,在识别结果存在错误的情况下,不用花费用户的劳力和时间就能够修正识别错误。对服务器装置(120)发送声音的特征量数据。然后,在服务器装置(120)中进行识别处理,接收部(235)从服务器装置(120)接收识别结果。错误区间指定部(240)根据可靠度等指定在接收到的识别结果中产生了识别错误的错误区间。然后,错误区间特征量提取部(260)提取错误区间的特征量数据,修正部(270)对提取出的错误区间中的识别结果进行再次识别处理,从而进行修正处理。
-
公开(公告)号:CN101794577A
公开(公告)日:2010-08-04
申请号:CN201010108535.2
申请日:2010-01-29
Applicant: 株式会社NTT都科摩
IPC: G10L15/28
CPC classification number: H04M3/42153 , G10L15/183 , G10L15/30 , G10L2015/228 , H04M2201/40 , H04M2201/405 , H04M2250/66
Abstract: 本发明提供声音识别服务器、电话机、声音识别系统以及声音识别方法。声音识别服务器(200)具备:声音接收部(202),其接收来自电话机(100)的声音;模型存储部(208),其存储用于将声音接收部(202)所接收的声音转换为字符的一个以上的声学模型以及一个以上的语言模型;号码判定部(204),其判定电话机(100)的当前呼出号码以及其它号码;模型选择部(206),其根据当前呼出号码以及其它号码选择模型存储部(208)中存储的声学模型,且根据当前呼出号码选择模型存储部(208)中存储的语言模型;和声音识别部(210),其根据模型选择部(206)所选择的声学模型以及语言模型,将声音接收部(202)所接收的声音转换为字符。
-
公开(公告)号:CN101567189A
公开(公告)日:2009-10-28
申请号:CN200910135059.0
申请日:2009-04-22
Applicant: 株式会社NTT都科摩
Abstract: 本发明提供声音识别结果修正装置、方法以及系统,在识别结果存在错误的情况下,不用花费用户的劳力和时间就能够修正识别错误。对服务器装置(120)发送声音的特征量数据。然后,在服务器装置(120)中进行识别处理,接收部(235)从服务器装置(120)接收识别结果。错误区间指定部(240)根据可靠度等指定在接收到的识别结果中产生了识别错误的错误区间。然后,错误区间特征量提取部(260)提取错误区间的特征量数据,修正部(270)对提取出的错误区间中的识别结果进行再次识别处理,从而进行修正处理。
-
公开(公告)号:CN1234110C
公开(公告)日:2005-12-28
申请号:CN200410028472.4
申请日:2004-03-12
Applicant: 株式会社NTT都科摩 , 古井貞熙
IPC: G10L15/14
CPC classification number: G10L15/20
Abstract: 本发明公开了语音识别噪声自适应系统、方法及程序,目的在于能够对许多类型的噪声数据进行最优聚类并且提高对输入语音的语音模型序列估计的精确度。根据信噪比条件向语音加入噪声以产生出加有噪声的语音(S1),从所产生出的加有噪声的语音中减去语音倒频谱的平均值(步骤S2);产生出每个加有噪声语音片断的高斯分布模型(步骤S3),并且计算出这些加有噪声语音片断的似然性以产生出一似然性矩阵(步骤S4),从而获得一聚类结果。选择出最优模型(步骤S7),并且进行线性变换以提供最大似然性(步骤S8)。因为加有噪声的语音一直用在聚类和模型学习中,所以可以实现对许多类型的噪声数据进行聚类并且精确估计出语音模型序列。
-
公开(公告)号:CN1542737A
公开(公告)日:2004-11-03
申请号:CN200410028472.4
申请日:2004-03-12
Applicant: 株式会社NTT都科摩 , 古井貞熙
CPC classification number: G10L15/20
Abstract: 本发明公开了语音识别噪声自适应系统、方法及程序,目的在于能够对许多类型的噪声数据进行最优聚类并且提高对输入语音的语音模型序列估计的精确度。根据信噪比条件向语音加入噪声以产生出加有噪声的语音(S1),从所产生出的加有噪声的语音中减去语音倒频谱的平均值(步骤S2);产生出每个加有噪声语音片断的高斯分布模型(步骤S3),并且计算出这些加有噪声语音片断的似然性以产生出一似然性矩阵(步骤S4),从而获得一聚类结果。选择出最优模型(步骤S7),并且进行线性变换以提供最大似然性(步骤S8)。因为加有噪声的语音一直用在聚类和模型学习中,所以可以实现对许多类型的噪声数据进行聚类并且精确估计出语音模型序列。
-
-
-
-
-