文本纠错模型训练、文本纠错方法、装置、设备和介质
Abstract:
本申请实施例涉及文本纠错技术领域,具体涉及一种文本纠错模型训练、文本纠错方法、装置、计算机设备和存储介质。该文本纠错模型训练方法包括:对训练样本集中的各样本按照预设纠错类别进行标签标注,得到标注结果;预设纠错类别至少包括:正确类别与多个错误类别;一个样本中至少包含一种错误类别;针对训练时输入文本纠错模型中的每个输入样本确定每个输入样本对应的输出样本;若输入样本不包含所有的错误类别,则降低计算损失函数计算过程中正确类别的损失占比,直到文本纠错模型达到收敛目标。在文本纠错模型训练之前就对样本进行了错误类别的识别与标签标注,可以防止误纠错,降低误纠率,进而提高纠错准确性、可靠性与纠错效率。
Patent Agency Ranking
0/0