-
公开(公告)号:CN114942977A
公开(公告)日:2022-08-26
申请号:CN202210599144.8
申请日:2022-05-30
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明是一种基于支持句预测的多任务文档级关系抽取方法及装置,属于计算机自然语言处理中信息抽取技术领域。本发明装置包括文档预处理模块,预训练语言模型,图网络编码模块,图传播模块,支持句识别模块和关系分类模块。本发明方法包括:将文档分句、预处理;以句子为单位使用预训练语言模型进行编码;根据文档结构和预定规则构建图网络;对图网络进行卷积操作;寻找实体对的支持句,获取关系推理路径;对实体对进行关系分类;预先将寻找实体对的前馈神经网络与关系分类的全连接神经网络一起训练。本发明提高了对复杂语境下文档的实体关系的挖掘,及文档级关系的抽取效率,能进一步帮助实现信息抽取、自动问答等多种NLP任务的准确性。
-
公开(公告)号:CN114942977B
公开(公告)日:2025-04-04
申请号:CN202210599144.8
申请日:2022-05-30
Applicant: 北京邮电大学
IPC: G06F16/334 , G06F16/353 , G06N3/0464 , G06F40/211 , G06N3/08
Abstract: 本发明是一种基于支持句预测的多任务文档级关系抽取方法及装置,属于计算机自然语言处理中信息抽取技术领域。本发明装置包括文档预处理模块,预训练语言模型,图网络编码模块,图传播模块,支持句识别模块和关系分类模块。本发明方法包括:将文档分句、预处理;以句子为单位使用预训练语言模型进行编码;根据文档结构和预定规则构建图网络;对图网络进行卷积操作;寻找实体对的支持句,获取关系推理路径;对实体对进行关系分类;预先将寻找实体对的前馈神经网络与关系分类的全连接神经网络一起训练。本发明提高了对复杂语境下文档的实体关系的挖掘,及文档级关系的抽取效率,能进一步帮助实现信息抽取、自动问答等多种NLP任务的准确性。
-