一种集成自编码和生成式语言模型的文档级关系抽取方法

    公开(公告)号:CN119129584A

    公开(公告)日:2024-12-13

    申请号:CN202411200524.5

    申请日:2024-08-29

    Abstract: 本发明提供了一种集成自编码和生成式语言模型的文档级关系抽取方法,首先利用文档级关系抽取数据集,微调以小型自编码预训练语言模型为编码器的文档级关系二分类模型,对文档中的所有实体对进行关系存在与否的二分类预测;然后将文档和存在关系的实体对填入提示词模板,微调生成式大语言模型,生成实体对的关系类别;最后利用自然语言推理模型,将大语言模型的生成结果与预设的关系标签进行对齐,以实现最终的文档级关系抽取。本发明提供了一种高效且准确的文档级关系抽取方法,克服了传统方法在长文本信息提取和逻辑推理方面的不足,显著提升了文档级关系抽取的性能和可靠性。

Patent Agency Ranking