-
公开(公告)号:CN115757831A
公开(公告)日:2023-03-07
申请号:CN202211502425.3
申请日:2022-11-28
Applicant: 南开大学
IPC: G06F16/36 , G06F16/28 , G06F40/216
Abstract: 本发明提出一种领域知识图谱半自动化构建的方法及装置,其中方法包括:对图书原文文档进行标注获取领域内实体关系三元组数据,组织成结构化数据,根据结构化数据构建精确标注知识图谱;根据三元组数据的实体关系及上下文内容基于seq2seq模型生成主语、宾语的描述,补全精确标注知识图谱中实体描述信息;基于补全实体描述信息的精确标注知识图谱通过Bert模型进行实体及关系预测,结合人工标注的实体关系信息构建领域知识图谱。本发明通过半自动化构建的方法及装置,利用人工标注提高数据的精确度,同时半自动化的构建算法可以在降低人工成本的同时挖掘数据之间的潜在关系,构建更为全面的领域知识图谱。