-
公开(公告)号:CN106503148A
公开(公告)日:2017-03-15
申请号:CN201610920031.8
申请日:2016-10-21
Applicant: 东南大学
CPC classification number: G06F16/367 , G06F16/288 , G06N5/022
Abstract: 本发明公开了一种基于多知识库的表格实体链接方法,主要用于解决表格中的实体链接问题。本发明首先对于给定表格中每个单元格里的字符串生成候选实体,这些候选实体抽取自给定的知识库。然后,提出一种通用的基于图的概率传播算法对每个单元格里的字符串对应的候选实体进行排序,该方法可作用于任意单一的知识库。再根据基于不同单一知识库的候选实体排序的结果,利用源自不同知识库中的实体间的等价关系,对每个单元格里的字符串所对应的抽取自不同知识库中的已排序候选实体进行划分。最后使用三种启发式规则以最终确定每个单元格里的字符串所应该链接的存在于不同知识库中的实体,从而完成基于多知识库的表格实体链接的任务。
-
公开(公告)号:CN106503148B
公开(公告)日:2019-05-31
申请号:CN201610920031.8
申请日:2016-10-21
Applicant: 东南大学
Abstract: 本发明公开了一种基于多知识库的表格实体链接方法,主要用于解决表格中的实体链接问题。本发明首先对于给定表格中每个单元格里的字符串生成候选实体,这些候选实体抽取自给定的知识库。然后,提出一种通用的基于图的概率传播算法对每个单元格里的字符串对应的候选实体进行排序,该方法可作用于任意单一的知识库。再根据基于不同单一知识库的候选实体排序的结果,利用源自不同知识库中的实体间的等价关系,对每个单元格里的字符串所对应的抽取自不同知识库中的已排序候选实体进行划分。最后使用三种启发式规则以最终确定每个单元格里的字符串所应该链接的存在于不同知识库中的实体,从而完成基于多知识库的表格实体链接的任务。
-