-
公开(公告)号:CN118471201B
公开(公告)日:2024-09-20
申请号:CN202410910592.4
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G10L15/06 , G10L15/01 , G10L15/18 , G10L15/183 , G10L15/26 , G10L15/16 , G06F40/117 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06N3/09
Abstract: 本发明提供了一种高效自适应面向语音识别引擎的热词纠错方法与系统,所述系统包括数据采集与分类模块、自适应数据扩增模块、热词纠错训练模块和热词纠错推理模块,数据采集与分类模块对实际应用中出现的误识别情况进行大规模的数据收集,并对收集的数据进行分类,自适应数据扩增模块针对特定的语音识别引擎,采集和增加热词相关的错误实例,构建用于热词纠错模型训练的训练数据集;热词纠错训练模块使用深度学习算法,构建一个针对语音识别引擎热词错误的纠错模型;热词纠错推理模块用于对语音识别引擎输出的文本信息进行错误检测和修正,并输出矫正正确的文本信息。通过本发明方案,提高了模型在热词纠错方面的整体性能和准确性。
-
公开(公告)号:CN118471201A
公开(公告)日:2024-08-09
申请号:CN202410910592.4
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G10L15/06 , G10L15/01 , G10L15/18 , G10L15/183 , G10L15/26 , G10L15/16 , G06F40/117 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06N3/09
Abstract: 本发明提供了一种高效自适应面向语音识别引擎的热词纠错方法与系统,所述系统包括数据采集与分类模块、自适应数据扩增模块、热词纠错训练模块和热词纠错推理模块,数据采集与分类模块对实际应用中出现的误识别情况进行大规模的数据收集,并对收集的数据进行分类,自适应数据扩增模块针对特定的语音识别引擎,采集和增加热词相关的错误实例,构建用于热词纠错模型训练的训练数据集;热词纠错训练模块使用深度学习算法,构建一个针对语音识别引擎热词错误的纠错模型;热词纠错推理模块用于对语音识别引擎输出的文本信息进行错误检测和修正,并输出矫正正确的文本信息。通过本发明方案,提高了模型在热词纠错方面的整体性能和准确性。
-