一种半自动提取和结构化文档信息的存储方法及系统

    公开(公告)号:CN109636303B

    公开(公告)日:2020-12-08

    申请号:CN201811262115.2

    申请日:2018-10-27

    Abstract: 本发明公开了一种半自动提取和结构化文档信息的存储方法及系统,主要实现对文档信息的半自动分类提取和结构化。系统中WebUI模块提供的Web界面用于支撑项目管理模块、提取项收集模块和用户管理模块;项目管理模块导入待分析的PDF文档;提取项收集模块对待提取列表中的信息进行人工校准和保存;用户管理模块是对用户权限的管理;采用存储模块保存文档元信息和提取项信息;实现对文档信息的自动化提取和结构化,核心采用自动化提取算法模块,用于将上传的文档扫描后自动检测生成提取项的页面预测,同时对提取项收集模块得到的信息进行结构化;本系统实现了对文档信息半自动提取和结构化,使存储的信息更合理化,同时提升了系统的速度和效率。

    一种半自动提取和结构化文档信息的存储方法及系统

    公开(公告)号:CN109636303A

    公开(公告)日:2019-04-16

    申请号:CN201811262115.2

    申请日:2018-10-27

    CPC classification number: G06Q10/103 H04L67/02 H04L67/06

    Abstract: 本发明公开了一种半自动提取和结构化文档信息的存储方法及系统,主要实现对文档信息的半自动分类提取和结构化。系统中WebUI模块提供的Web界面用于支撑项目管理模块、提取项收集模块和用户管理模块;项目管理模块导入待分析的PDF文档;提取项收集模块对待提取列表中的信息进行人工校准和保存;用户管理模块是对用户权限的管理;采用存储模块保存文档元信息和提取项信息;实现对文档信息的自动化提取和结构化,核心采用自动化提取算法模块,用于将上传的文档扫描后自动检测生成提取项的页面预测,同时对提取项收集模块得到的信息进行结构化;本系统实现了对文档信息半自动提取和结构化,使存储的信息更合理化,同时提升了系统的速度和效率。

Patent Agency Ranking