-
公开(公告)号:CN112883203A
公开(公告)日:2021-06-01
申请号:CN202110325682.3
申请日:2021-03-26
Applicant: 南京邮电大学
IPC: G06F16/36 , G06F40/279 , G06F16/951
Abstract: 一种大规模知识图谱构建系统,领域文献通过文献格式转换模块将PDF格式转换为word格式,文献格式转换模块将文章分别传输到文献标题、作者及相关信息提取模块、摘要信息抽取模块和参考文献相关信息补全模块;文献标题、作者及相关信息提取模块从文章中提取出信息,并传输到文献标题、作者及相关信息标准化处理模块进行标准化处理;各模块获取的信息通过各项信息对应组合模块进行对应处理,处理后通过知识图谱生成和存储模块生成知识图谱。本发明采用自适应处理异构文本信息技术,利用不同判决条件自适应处理异构、不同专业领域的文章;并通过动态补全文章中不完整信息技术,基于参考文献标题信息并结合网上信息动态补全文章参考文献信息的不足之处。