-
公开(公告)号:CN117150034A
公开(公告)日:2023-12-01
申请号:CN202310987699.4
申请日:2023-08-07
Applicant: 海南大学
IPC: G06F16/36 , G06N3/088 , G06F40/279
Abstract: 本发明公开大规模跨语言知识图谱间的无监督实体对齐方法和系统,属于实体对齐领域。在特征嵌入阶段,基于知识图谱的多视图信息,从语义和字符两个层面进行嵌入。语义层面,使用预训练的大语言模型(LLM,Large Language Model)进行嵌入。字符层面,使用N‑Gram模型进行嵌入。在对齐阶段,先融合多视图信息,分别生成语义和字符层面的相似度矩阵。再采用加权的方式融合语义和字符的相似度矩阵,生成对齐矩阵。最后,依据对齐矩阵完成对齐任务。本发明不需要事先进行任何数据标注,属于无监督的实体对齐;语义和字符两个层面的特征嵌入,更好地捕获了待对齐实体特征;组合语义特征和字符特征,提高了对齐准确度并保证对齐效率,适用于各种跨语言知识图谱间的实体对齐任务。