-
公开(公告)号:CN111985219A
公开(公告)日:2020-11-24
申请号:CN202010751644.X
申请日:2020-07-30
Applicant: 哈尔滨工业大学
IPC: G06F40/253 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明是一种融合单语数据的文本语法错误纠正方法。本发明属于文本纠错技术领域,构建反向语法错误生成模型,并对所述反向语法错误生成模型进行训练;根据训练后的反向语法错误生成模型,对含有语法错误的文本,进行构造错误纠正平行句对;采用对抗训练反向语法错误生成模型,对错误纠正平行句对区分语法错误句子;采用对抗训练正向语法错误纠正模型,对语法错误句子进行纠正。本发明首次在back-translation中采用sampling解码策略来构造伪“错误-纠正”平行句对;基于对抗学习框架训练语法错误生成模型,并用其构造更真实的伪“错误-纠正”平行语料。