一种基于大模型知识蒸馏的文档级事件抽取方法及装置

    公开(公告)号:CN119962515A

    公开(公告)日:2025-05-09

    申请号:CN202510034936.4

    申请日:2025-01-09

    Abstract: 本发明提出一种基于大模型知识蒸馏的文档级事件抽取方法,包括:构建训练文档的事件本体信息;基于事件本体信息和大语言模型,构建训练文档的包含上下文信息的事件抽取问题;获取与事件抽取问题匹配的强相关片段;以教师模型基于该强相关片段生成软标签,以软标签构建软标签数据集;构建问答模型,以软标签数据集训练问答模型;以完成训练的问答模型,对目标文档进行事件抽取操作。本发明还提出一种基于大模型知识蒸馏的文档级事件抽取装置。本发明提供一种文档级事件抽取的方法,利用预训练大模型的知识,将其在长文本和复杂事件处理方面的丰富信息迁移到较小的问答模型中,在较少标注数据的情况下,提高事件识别和论元提取的准确率。

Patent Agency Ranking