-
公开(公告)号:CN118153679A
公开(公告)日:2024-06-07
申请号:CN202410326798.2
申请日:2024-03-21
Applicant: 东北大学
IPC: G06N5/022 , G06N3/042 , G06N3/0499 , G06N3/0895 , G06N3/084
Abstract: 本发明设计一种基于多跳注意力机制的半监督实体对齐方法,首先对知识图谱数据进行预处理,并划分得到训练集和测试集;对经处理的知识图谱数据中的实体名和关系信息进行特征提取并构建特征向量;构造实体对齐模型,模型输入为特征向量,输出经过训练优化的实体向量,使得具有相同含义的实体表示在向量空间中距离更接近,即通过空间距离计算得到对齐的实体;本发明采用了注意力扩散机制的多跳注意力网络,能捕获多跳邻居节点的信息,使得实体对齐模型能够聚焦于对当前任务最重要的信息;对于标签数据的依赖问题,采用延迟接受算法和基于频次的采样方式将伪对齐对标记为训练数据,以半监督的方式训练得到一个端到端的实体对齐模型。