基于Python的数据中台非结构化文档管理方法

    公开(公告)号:CN117171104A

    公开(公告)日:2023-12-05

    申请号:CN202311185682.3

    申请日:2023-09-14

    Abstract: 本发明涉及一种基于Python的数据中台非结构化文档管理方法,属于大数据领域。本发明包括数据接入与数据解析、文件目录解析与文件元数据提取、根据提取的全面数据进行数据治理三个部分。本发明创建脚本方法完成数据分析,元数据提取,数据入库。在数据入库层面支持国产化和非国产化等多种数据库。本发明可以快速获取当前需要处理的数据全部信息,在已有数据的基础上进行数据治理,利用已有文件路径信息,进行简单的逻辑加工后生成客户所需求的路径,快捷生成路径并自动针对文件对应的路径调用中台接口快速上传对应的文件。

Patent Agency Ranking