一种基于多跳注意力机制的半监督实体对齐方法

    公开(公告)号:CN118153679A

    公开(公告)日:2024-06-07

    申请号:CN202410326798.2

    申请日:2024-03-21

    Applicant: 东北大学

    Abstract: 本发明设计一种基于多跳注意力机制的半监督实体对齐方法,首先对知识图谱数据进行预处理,并划分得到训练集和测试集;对经处理的知识图谱数据中的实体名和关系信息进行特征提取并构建特征向量;构造实体对齐模型,模型输入为特征向量,输出经过训练优化的实体向量,使得具有相同含义的实体表示在向量空间中距离更接近,即通过空间距离计算得到对齐的实体;本发明采用了注意力扩散机制的多跳注意力网络,能捕获多跳邻居节点的信息,使得实体对齐模型能够聚焦于对当前任务最重要的信息;对于标签数据的依赖问题,采用延迟接受算法和基于频次的采样方式将伪对齐对标记为训练数据,以半监督的方式训练得到一个端到端的实体对齐模型。

    一种距离感知和多步推理的文档级关系抽取方法

    公开(公告)号:CN118332111A

    公开(公告)日:2024-07-12

    申请号:CN202410354895.2

    申请日:2024-03-27

    Applicant: 东北大学

    Abstract: 本发明设计一种距离感知和多步推理的文档级关系抽取方法;首先将文档输入基于Transformer的预训练语言模型,得到编码后的文本序列向量;利用注意力机制寻找文档中能够帮助关系抽取模型确定实体对关系的上下文信息向量;利用带有距离信息的提及聚合模块,将提及之间的距离信息融入注意力机制中,并为实体的各个提及计算出聚合权重,最后将提及的向量特征聚合为实体对向量特征;利用多步推理模块构建实体对图将实体对特征作为节点特征,利用图注意力神经网络让实体对能够感知并聚合其它实体对的特征信息以更新自身的特征,达到多步推理的效果,最后将图神经网络得到的节点特征和节点对应的实体特征融合,得到新的实体对特征;最后计算关系抽取的损失。

Patent Agency Ranking