-
公开(公告)号:CN112926302A
公开(公告)日:2021-06-08
申请号:CN202110162943.4
申请日:2021-02-05
Applicant: 北京华宇信息技术有限公司
IPC: G06F40/205 , G06F40/279 , G06N3/04 , G06N3/08 , G10L15/26
Abstract: 本申请公开了一种语音识别文本的断句与标点预测方法及其装置、存储介质。其中所述方法,包括:获取语音解码输出的待处理文本;通过断句和符号预测模型处理所述待处理文本,生成预测结果;根据所述预测结果,生成带标点符号的最终文本。通过用语言模型对语音解码输出的待处理文本进行处理,实现了对语音识别文本的断句和标点符号预测。
-
-
公开(公告)号:CN113205813B
公开(公告)日:2022-03-11
申请号:CN202110357882.7
申请日:2021-04-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。
-
公开(公告)号:CN113205813A
公开(公告)日:2021-08-03
申请号:CN202110357882.7
申请日:2021-04-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。
-
-
-