-
公开(公告)号:CN112036174A
公开(公告)日:2020-12-04
申请号:CN201910407855.9
申请日:2019-05-15
Applicant: 南京大学
IPC: G06F40/289 , G10L15/26
Abstract: 本公开涉及一种标点标注方法及装置。包括:获取语音识别得到的动态文本,所述动态文本中包括至少一个词语;依次获取所述词语,并将所述词语输入至标注模型,经所述标注模型输出所述词语的预测标点;判断所述预测标点的置信度是否不小于预设值,若所述置信度不小于所述预设值,则在所述词语之后标注所述预测标点。本公开以字或词语作为最小的处理单元,首先通过预测模型对所述字或词进行标点预测,并通过判断置信度的方式,对预测的准确性进行校准,显著的缩短了从音频中出现某个字或词到输出标注结果的时延,输出结果实时性较高,且准确性较强,不需要对标注结果进行二次修正,用户体验好。
-
公开(公告)号:CN112036174B
公开(公告)日:2023-11-07
申请号:CN201910407855.9
申请日:2019-05-15
Applicant: 南京大学
IPC: G06F40/289 , G10L15/26
Abstract: 本公开涉及一种标点标注方法及装置。包括:获取语音识别得到的动态文本,所述动态文本中包括至少一个词语;依次获取所述词语,并将所述词语输入至标注模型,经所述标注模型输出所述词语的预测标点;判断所述预测标点的置信度是否不小于预设值,若所述置信度不小于所述预设值,则在所述词语之后标注所述预测标点。本公开以字或词语作为最小的处理单元,首先通过预测模型对所述字或词进行标点预测,并通过判断置信度的方式,对预测的准确性进行校准,显著的缩短了从音频中出现某个字或词到输出标注结果的时延,输出结果实时性较高,且准确性较强,不需要对标注结果进行二次修正,用户体验好。
-