-
公开(公告)号:CN110675855B
公开(公告)日:2022-03-25
申请号:CN201910952464.5
申请日:2019-10-09
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种语音识别方法、电子设备及计算机可读存储介质,通过将接收到的待识别语音的特征信息输入至语言识别系统进行识别,以获取语音识别结果,其中,语言识别系统包括预先创建的发音字典、声学模型和语言模型,所述发音字典包括根据音素级语音识别系统构建的第二语种词语的发音图,所述音素级语音识别系统包括所述声学模型和语言模型,所述声学模型基于所述第一语种音素集训练获得,所述语言模型基于所述第一语种音素集构建,由此,可以根据第一语种音素集对第二语种词语进行注音,提高了语音识别的准确率。
-
公开(公告)号:CN112053686A
公开(公告)日:2020-12-08
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN112053686B
公开(公告)日:2024-01-02
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN110675855A
公开(公告)日:2020-01-10
申请号:CN201910952464.5
申请日:2019-10-09
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种语音识别方法、电子设备及计算机可读存储介质,通过将接收到的待识别语音的特征信息输入至语言识别系统进行识别,以获取语音识别结果,其中,语言识别系统包括预先创建的发音字典、声学模型和语言模型,所述发音字典包括根据音素级语音识别系统构建的第二语种词语的发音图,所述音素级语音识别系统包括所述声学模型和语言模型,所述声学模型基于所述第一语种音素集训练获得,所述语言模型基于所述第一语种音素集构建,由此,可以根据第一语种音素集对第二语种词语进行注音,提高了语音识别的准确率。
-
-
-