一种基于依存句法图和短语结构树的文档级关系抽取方法

    公开(公告)号:CN116702755A

    公开(公告)日:2023-09-05

    申请号:CN202310749338.6

    申请日:2023-06-21

    Abstract: 本发明公开了一种基于依存句法图和短语结构树的文档级关系抽取方法,包括以下步骤:对文档进行编码,通过预训练语言模型,获取文档的字符级嵌入表示和注意力矩阵;构建短语结构树,计算实体对间关系的预测值;构建包含两类节点和三类边的依存句法图,根据依存句法图和文档中的字符级嵌入表示计算实体对间基于依存句法关系的预测值;根据实体对间基于依存句法关系的预测值和实体对间关系的预测值得到最后的预测值,根据最后的预测值获得损失函数,利用损失函数训练依存句法关系模型,使用训练好的依存句法关系模型对待处理文档进行处理,实现文档级的关系抽取,本方案通过考虑文档的语法信息,来实现文档级关系抽取,提升了文档关系抽取效果。

Patent Agency Ranking