-
公开(公告)号:CN116257643A
公开(公告)日:2023-06-13
申请号:CN202310515242.3
申请日:2023-05-09
Applicant: 鹏城实验室
IPC: G06F16/36 , G06F16/901 , G06F40/279
Abstract: 本申请公开了一种跨语言实体对齐方法、装置、设备及可读存储介质,该方法包括步骤:获取待融合的跨语言知识图谱,以及获取跨语言知识图谱对应的第一对齐种子;将跨语言知识图谱内的文本翻译成统一语言文本,并对统一语言文本对应的实体向量进行初步对齐,得到初步对齐结果;确定实体向量间的相似度,并将大于等于第一预设相似度的相似度所对应的统一语言文本作为第二对齐种子;根据第一对齐种子和第二对齐种子,按照文本相似度和/或语义相似度,分批调整初步对齐结果中的实体向量;将调整后的实体向量中相似度最高的实体向量进行对齐,得到目标对齐结果。本申请实现了根据文本相似度和语义相似度,分批调整初步对齐结果,得到目标对齐结果。
-
公开(公告)号:CN116257643B
公开(公告)日:2023-08-25
申请号:CN202310515242.3
申请日:2023-05-09
Applicant: 鹏城实验室
IPC: G06F16/36 , G06F16/901 , G06F40/279
Abstract: 本申请公开了一种跨语言实体对齐方法、装置、设备及可读存储介质,该方法包括步骤:获取待融合的跨语言知识图谱,以及获取跨语言知识图谱对应的第一对齐种子;将跨语言知识图谱内的文本翻译成统一语言文本,并对统一语言文本对应的实体向量进行初步对齐,得到初步对齐结果;确定实体向量间的相似度,并将大于等于第一预设相似度的相似度所对应的统一语言文本作为第二对齐种子;根据第一对齐种子和第二对齐种子,按照文本相似度和/或语义相似度,分批调整初步对齐结果中的实体向量;将调整后的实体向量中相似度最高的实体向量进行对齐,得到目标对齐结果。本申请实现了根据文本相似度和语义相似度,分批调整初步对齐结果,得到目标对齐结果。
-