一种基于集成学习的关系抽取方法及系统

    公开(公告)号:CN111125434B

    公开(公告)日:2023-06-27

    申请号:CN201911171322.1

    申请日:2019-11-26

    Abstract: 本发明涉及自然语言处理和深度学习技术领域,特别涉及一种处理远程监督关系抽取中重复实体方法及系统。本发明的主要技术方案包括:将语料根据实体对组成句包,确定含重复实体语句中的目标实体位置;构建包含语义和位置信息的词向量;通过多角度卷积神经网络,构建句向量;通过动态路由机制,构建句包级别的向量以及对句包分类。本发明提供的关系抽取方法及系统定位到并能够有效处理现有远程监督关系抽取方法及系统没有提及的重复实体导致的注意力偏差问题。

    一种基于共指消歧的文档级事件抽取方法

    公开(公告)号:CN116861996A

    公开(公告)日:2023-10-10

    申请号:CN202310701623.0

    申请日:2023-06-14

    Inventor: 孙新 李帆 姜景虎

    Abstract: 本发明涉及自然语言处理和深度学习技术领域,特别涉及一种基于共指消歧的文档级事件抽取方法。本发明的主要技术方案包括:通过命名实体识别得到文档中的全部命名实体;通过共指消歧将表示同一事物的实体集合在一起,得到共指实体集合;利用实体交互、句子交互和共指关系对文档进行处理,得到一个以句子为结点的同构图;将具有相似语义或主题的句子集合在一起,并采用句子级注意力机制进行降噪处理,得到句子团体;对句子团体进行分类,得到事件类型,进一步得到对应的论元。通过本发明的抽取方法,能够有效处理现有文档级事件抽取方法没有考虑共指消歧和句子团体内噪声影响的问题。

    一种基于集成学习的关系抽取方法及系统

    公开(公告)号:CN111125434A

    公开(公告)日:2020-05-08

    申请号:CN201911171322.1

    申请日:2019-11-26

    Abstract: 本发明涉及自然语言处理和深度学习技术领域,特别涉及一种处理远程监督关系抽取中重复实体方法及系统。本发明的主要技术方案包括:将语料根据实体对组成句包,确定含重复实体语句中的目标实体位置;构建包含语义和位置信息的词向量;通过多角度卷积神经网络,构建句向量;通过动态路由机制,构建句包级别的向量以及对句包分类。本发明提供的关系抽取方法及系统定位到并能够有效处理现有远程监督关系抽取方法及系统没有提及的重复实体导致的注意力偏差问题。

Patent Agency Ranking