-
公开(公告)号:CN114090783A
公开(公告)日:2022-02-25
申请号:CN202111202752.2
申请日:2021-10-15
Applicant: 北京大学
Abstract: 本发明涉及一种异构知识图谱融合方法及系统,针对现有技术存在着单一结构信息难以区分相同概念下的不同实体以及有限的训练数据限制了基于知识图谱嵌入方法的实体嵌入表示学习准确性等问题,本发明提供一种融合结构信息与属性信息的异构知识图谱融合方法,本发明的效果在于,充分利用图谱中的两种信息:实体结构和实体属性,通过知识表示学习模型得到基于结构的实体表示向量,通过基于共享注意力机制的孪生神经网络模型来学习基于实体属性的实体表示。每次迭代两种信息找到的最佳匹配都打上标记,作为新标记数据补充到训练集中,使得两种信息的模型相互辅助,迭代增强,最终得到准确度较高的实体对齐结果。
-
公开(公告)号:CN114091406A
公开(公告)日:2022-02-25
申请号:CN202111202937.3
申请日:2021-10-15
Applicant: 北京大学
IPC: G06F40/117 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明涉及一种面向知识抽取的智能文本标注方法及系统,针对知识抽取过程存在的深度学习模型缺乏标注数据,且人工数据标注繁琐,需要领域专家大量人工操作,耗时耗力等问题,面向知识抽取的实体识别和关系抽取两个阶段,提出基于主动学习的智能标注方法与系统,本发明的效果在于,当获取完全无标签数据时,领域专家可以自由设定标注模型和标注批次规模等参数,边标注数据,边使实体识别和关系抽取联合模型学习该知识抽取行为,在尽可能少的标注轮次后完成深度学习模型的训练,进而完成整个数据集的知识抽取。
-