-
公开(公告)号:CN114077830B
公开(公告)日:2024-10-25
申请号:CN202010826082.0
申请日:2020-08-17
Applicant: 税友软件集团股份有限公司
IPC: G06F40/205
Abstract: 本申请公开了一种基于位置的PDF表格文档的解析方法,由于PDF官方规范支持告诉表格文档中具体字符串的位置,该方法首先通过文本提取确定PDF表格文档中每个字符串的位置信息,然后根据位置信息确定字符串与表格中单元格的对应关系,最终进行字符串填充,实现了将PDF表格文档解析为便于进行数据分析处理的表格形式。此外,本申请还提供了一种基于位置的PDF表格文档的解析装置、设备及可读存储介质,其技术效果与上述方法相对应。
-
公开(公告)号:CN114077830A
公开(公告)日:2022-02-22
申请号:CN202010826082.0
申请日:2020-08-17
Applicant: 税友软件集团股份有限公司
IPC: G06F40/205
Abstract: 本申请公开了一种基于位置的PDF表格文档的解析方法,由于PDF官方规范支持告诉表格文档中具体字符串的位置,该方法首先通过文本提取确定PDF表格文档中每个字符串的位置信息,然后根据位置信息确定字符串与表格中单元格的对应关系,最终进行字符串填充,实现了将PDF表格文档解析为便于进行数据分析处理的表格形式。此外,本申请还提供了一种基于位置的PDF表格文档的解析装置、设备及可读存储介质,其技术效果与上述方法相对应。
-