-
公开(公告)号:CN108132916A
公开(公告)日:2018-06-08
申请号:CN201711235867.5
申请日:2017-11-30
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供一种解析PDF表格数据的方法、存储介质,方法包括:获取每页PDF的各线段的坐标和各字符的坐标;依据线段交点划分出单元格,并获取各单元格对应的矩形坐标;依据字符的坐标与矩形坐标的包含关系,获取各单元格对应的字段块。本发明依据各线段和各字符坐标的关系精确划分出单元格和单元格内的字符,精确提取PDF的表格以及表格内的数据,实现PDF表格的准确、便捷、自动化解析。
-
公开(公告)号:CN108132916B
公开(公告)日:2022-02-11
申请号:CN201711235867.5
申请日:2017-11-30
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F40/103 , G06F40/18 , G06F40/117
Abstract: 本发明提供一种解析PDF表格数据的方法、存储介质,方法包括:获取每页PDF的各线段的坐标和各字符的坐标;依据线段交点划分出单元格,并获取各单元格对应的矩形坐标;依据字符的坐标与矩形坐标的包含关系,获取各单元格对应的字段块。本发明依据各线段和各字符坐标的关系精确划分出单元格和单元格内的字符,精确提取PDF的表格以及表格内的数据,实现PDF表格的准确、便捷、自动化解析。
-