一种基于深度学习的人物关系图谱构建方法及系统

    公开(公告)号:CN111538849B

    公开(公告)日:2023-04-07

    申请号:CN202010358399.6

    申请日:2020-04-29

    Abstract: 本发明公开了一种基于深度学习的人物关系图谱构建方法及系统,所属方法包括:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;设置模型超参数,结合预处理后的样本数据建立深度学习模型;定义具有层次化的人物信息模板,并基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;利用填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。如此,本发明能够解决多值人物属性以及存在于分散文本的人物关系发现与提取问题,进而提高了人物关系图谱构建的准确性和信息丰富度。

    一种基于深度学习的人物关系图谱构建方法及系统

    公开(公告)号:CN111538849A

    公开(公告)日:2020-08-14

    申请号:CN202010358399.6

    申请日:2020-04-29

    Abstract: 本发明公开了一种基于深度学习的人物关系图谱构建方法及系统,所属方法包括:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;设置模型超参数,结合预处理后的样本数据建立深度学习模型;定义具有层次化的人物信息模板,并基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;利用填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。如此,本发明能够解决多值人物属性以及存在于分散文本的人物关系发现与提取问题,进而提高了人物关系图谱构建的准确性和信息丰富度。

    一种半自动提取和结构化文档信息的存储方法及系统

    公开(公告)号:CN109636303B

    公开(公告)日:2020-12-08

    申请号:CN201811262115.2

    申请日:2018-10-27

    Abstract: 本发明公开了一种半自动提取和结构化文档信息的存储方法及系统,主要实现对文档信息的半自动分类提取和结构化。系统中WebUI模块提供的Web界面用于支撑项目管理模块、提取项收集模块和用户管理模块;项目管理模块导入待分析的PDF文档;提取项收集模块对待提取列表中的信息进行人工校准和保存;用户管理模块是对用户权限的管理;采用存储模块保存文档元信息和提取项信息;实现对文档信息的自动化提取和结构化,核心采用自动化提取算法模块,用于将上传的文档扫描后自动检测生成提取项的页面预测,同时对提取项收集模块得到的信息进行结构化;本系统实现了对文档信息半自动提取和结构化,使存储的信息更合理化,同时提升了系统的速度和效率。

    一种半自动提取和结构化文档信息的存储方法及系统

    公开(公告)号:CN109636303A

    公开(公告)日:2019-04-16

    申请号:CN201811262115.2

    申请日:2018-10-27

    CPC classification number: G06Q10/103 H04L67/02 H04L67/06

    Abstract: 本发明公开了一种半自动提取和结构化文档信息的存储方法及系统,主要实现对文档信息的半自动分类提取和结构化。系统中WebUI模块提供的Web界面用于支撑项目管理模块、提取项收集模块和用户管理模块;项目管理模块导入待分析的PDF文档;提取项收集模块对待提取列表中的信息进行人工校准和保存;用户管理模块是对用户权限的管理;采用存储模块保存文档元信息和提取项信息;实现对文档信息的自动化提取和结构化,核心采用自动化提取算法模块,用于将上传的文档扫描后自动检测生成提取项的页面预测,同时对提取项收集模块得到的信息进行结构化;本系统实现了对文档信息半自动提取和结构化,使存储的信息更合理化,同时提升了系统的速度和效率。

Patent Agency Ranking