-
公开(公告)号:CN116628164A
公开(公告)日:2023-08-22
申请号:CN202310608297.9
申请日:2023-05-27
Applicant: 哈尔滨理工大学
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06F17/18 , G06N3/0442 , G06N3/084 , G06N3/0455 , G06N3/096
Abstract: 一种难度可控的问题生成数据增强方法,本方法涉及自然语言处理技术,该方法是在问答生成任务分解为答案的序列标注任务和问题的生成任务两部分,答案合成模块和问题合成模块。然后,在问题合成模块中增加一个多跳推理模块。该模块可根据问题的语义,生成指示向量控制多跳推理过程,基于指示向量逐步更新图中节点表示,双向推理中间增加自我监控信号,生成当前推理中各实体分布。最后,通过学习到的中间实体分布改进自己,奖励机制以达到难度可控的效果。与其他方法相比,本方法可根据需求灵活地调整难度参数,生成具有不同难度的问题达到数据增强。