-
公开(公告)号:CN115630635B
公开(公告)日:2023-04-25
申请号:CN202211639239.4
申请日:2022-12-20
Applicant: 苏州大学
IPC: G06F40/232 , G06F40/253 , G06F16/33 , G06F40/194 , G06N3/0464
Abstract: 本发明实施例提供了一种基于检索和多阶段的中文文本校对方法、系统及设备,该方法包括输入纠错文本,在数据库中寻找与纠错文本最相似的文本,并将最相似文本和所述纠错文本进行拼接,得到拼接文本;对所述拼接文本进行拼写纠正;对拼写纠正后的文本进行基于序列到编辑的语法纠正得到修改结果一;将所述修改结果一和纠错文本基于序列到序列的语法纠正通过设置阈值范围得到的修改结果二进行困惑度比较;将困惑度低的修改结果作为最后的修改结果。本发明能有效提升系统的鲁棒性,在改善多种类型文本错误的同时提升检测错误和纠正错误的准确率。
-
公开(公告)号:CN115630635A
公开(公告)日:2023-01-20
申请号:CN202211639239.4
申请日:2022-12-20
Applicant: 苏州大学
IPC: G06F40/232 , G06F40/253 , G06F16/33 , G06F40/194 , G06N3/0464
Abstract: 本发明实施例提供了一种基于检索和多阶段的中文文本校对方法、系统及设备,该方法包括输入纠错文本,在数据库中寻找与纠错文本最相似的文本,并将最相似文本和所述纠错文本进行拼接,得到拼接文本;对所述拼接文本进行拼写纠正;对拼写纠正后的文本进行基于序列到编辑的语法纠正得到修改结果一;将所述修改结果一和纠错文本基于序列到序列的语法纠正通过设置阈值范围得到的修改结果二进行困惑度比较;将困惑度低的修改结果作为最后的修改结果。本发明能有效提升系统的鲁棒性,在改善多种类型文本错误的同时提升检测错误和纠正错误的准确率。
-