文本纠错模型训练、文本纠错方法、装置、设备和介质

Invention Publication

CN117743857A 文本纠错模型训练、文本纠错方法、装置、设备和介质有权

Please log in to see more content

Patent Title: 文本纠错模型训练、文本纠错方法、装置、设备和介质
Application No.: CN202311864820.0

Application Date: 2023-12-29
Publication No.: CN117743857A

Publication Date: 2024-03-22
Inventor: 张阳 , 马东升 , 蒋红宇
Applicant: 北京海泰方圆科技股份有限公司
Applicant Address: 北京市海淀区东北旺西路8号中关村软件园9号楼国际软件大厦E座一层、二层
Assignee: 北京海泰方圆科技股份有限公司
Current Assignee: 北京海泰方圆科技股份有限公司
Current Assignee Address: 北京市海淀区东北旺西路8号中关村软件园9号楼国际软件大厦E座一层、二层
Agency: 北京科慧致远知识产权代理有限公司
Agent 王乾旭
Main IPC: G06F18/214
IPC: G06F18/214 ; G06F18/241 ; G06F40/289 ; G06F40/295

Abstract:

本申请实施例涉及文本纠错技术领域，具体涉及一种文本纠错模型训练、文本纠错方法、装置、计算机设备和存储介质。该文本纠错模型训练方法包括：对训练样本集中的各样本按照预设纠错类别进行标签标注，得到标注结果；预设纠错类别至少包括：正确类别与多个错误类别；一个样本中至少包含一种错误类别；针对训练时输入文本纠错模型中的每个输入样本确定每个输入样本对应的输出样本；若输入样本不包含所有的错误类别，则降低计算损失函数计算过程中正确类别的损失占比，直到文本纠错模型达到收敛目标。在文本纠错模型训练之前就对样本进行了错误类别的识别与标签标注，可以防止误纠错，降低误纠率，进而提高纠错准确性、可靠性与纠错效率。

Public/Granted literature

CN117743857B 文本纠错模型训练、文本纠错方法、装置、设备和介质 Public/Granted day:2024-09-17

Information query

Chinese Patent Announcement Global Dossier Espacenet