-
公开(公告)号:CN112861538A
公开(公告)日:2021-05-28
申请号:CN202110182336.4
申请日:2021-02-08
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/30 , G06F40/211
Abstract: 本发明为解决传统实体链接方法需要大量人工标注,所带来的成本等问题,提出了一种基于上下文语义关系和文档一致性约束的实体链接方法。本发明分为三个步骤:数据预处理,候选实体生成和候选实体消歧;在数据预处理阶段,解决数据存在的噪音问题;在候选实体生成阶段,利用维基百科连接图的过滤技术,得到具有较高召回率的候选实体集合;在候选实体消歧阶段,利用候选实体集合作为弱监督约束,考虑实体与其局部上下文之间的关系和文档中实体与实体之间的连贯性信息,通过神经网络进行候选实体消歧,得到最终的实体链接结果,将候选实体对应到知识图谱中。
-
公开(公告)号:CN112784604A
公开(公告)日:2021-05-11
申请号:CN202110172278.7
申请日:2021-02-08
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/30 , G06F40/211
Abstract: 本发明提出了一种基于实体边界网络的实体链接方法,首先候选实体生成,通过候选实体提取和候选实体匹配来保证候选实体列表具有较高的召回率;再进行候选实体消歧,构建基于关键词的神经网络模型,利用实体描述信息,语义信息和上下文信息,使用一个损失函数来处理多个加权类型,然后使用全连接网络进行训练,最后通过二分类方法得到实体链接的预测结果,输出实体链接关系;和现有方案相比,本发明具有更高的实体召回率。
-