一种基于位置的PDF表格文档的解析方法、装置及设备

    公开(公告)号:CN114077830B

    公开(公告)日:2024-10-25

    申请号:CN202010826082.0

    申请日:2020-08-17

    Abstract: 本申请公开了一种基于位置的PDF表格文档的解析方法,由于PDF官方规范支持告诉表格文档中具体字符串的位置,该方法首先通过文本提取确定PDF表格文档中每个字符串的位置信息,然后根据位置信息确定字符串与表格中单元格的对应关系,最终进行字符串填充,实现了将PDF表格文档解析为便于进行数据分析处理的表格形式。此外,本申请还提供了一种基于位置的PDF表格文档的解析装置、设备及可读存储介质,其技术效果与上述方法相对应。

    一种基于位置的PDF表格文档的解析方法、装置及设备

    公开(公告)号:CN114077830A

    公开(公告)日:2022-02-22

    申请号:CN202010826082.0

    申请日:2020-08-17

    Abstract: 本申请公开了一种基于位置的PDF表格文档的解析方法,由于PDF官方规范支持告诉表格文档中具体字符串的位置,该方法首先通过文本提取确定PDF表格文档中每个字符串的位置信息,然后根据位置信息确定字符串与表格中单元格的对应关系,最终进行字符串填充,实现了将PDF表格文档解析为便于进行数据分析处理的表格形式。此外,本申请还提供了一种基于位置的PDF表格文档的解析装置、设备及可读存储介质,其技术效果与上述方法相对应。

Patent Agency Ranking