-
公开(公告)号:CN116052655A
公开(公告)日:2023-05-02
申请号:CN202211710465.7
申请日:2022-12-29
Applicant: 出门问问信息科技有限公司
IPC: G10L15/197 , G10L15/26 , G10L15/06 , G10L19/16
Abstract: 本申请实施例提供了一种音频处理方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,本申请实施例可以获取目标音频,根据目标语音识别模型中的声学识别模块确定目标音频对应的发音概率矩阵,并根据目标语音识别模型中的语言识别模块和发音概率矩阵,确定目标音频对应的文字信息。进一步的,本申请实施例可以对文字信息进行融合解码处理,以确定目标音频对应的音频识别结果。其中,本申请实施例可以在发音概率矩阵对应的概率空间中搜索概率较大的文字信息,降低了音频和文本之间的数据依赖,在面对新出现的词汇或者生僻词汇时,本申请实施例可以增加模型输出的可能性,提高语音识别的准确率。