-
公开(公告)号:CN113032585B
公开(公告)日:2021-08-20
申请号:CN202110597525.8
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。
-
公开(公告)号:CN113032585A
公开(公告)日:2021-06-25
申请号:CN202110597525.8
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于文档结构和外部知识的文档级实体关系抽取方法,所述方法包括:获取文档文本,并根据所述文档文本构建文档文本对应的结构图,初始化所述结构图的所述结点和所述边,得到结构图初始化结果;基于结构图、所述结构图初始化结果、经过训练的面向边的图神经网络模型,得到更新后的边,并将所述更新后的边输入分类器,得到所述文档文本的实体关系抽取结果。本发明实施例通过上述方法得到实体关系抽取结果,提升文档级别关系抽取的性能,解决了正负样例不均衡的问题,具备更好的处理部分知识缺失的能力,同时具有较好的可扩展性。
-