一种基于分析工具SPARK的增值税数据整合方法及系统

    公开(公告)号:CN108255819A

    公开(公告)日:2018-07-06

    申请号:CN201611224500.9

    申请日:2016-12-27

    Abstract: 本发明通过一种基于分析工具SPARK的增值税数据整合方法及系统,为税务机关提供了一种常用的增值税分析的数据模型,可以在税务局规定时间内完成其业务需求对应的数据处理过程,帮助税务局更好的分析增值税数据、监控疑点纳税人,是有效监控和分析不法企业偷逃税款、保障税务收入的重要手段;提高了税务机关纳税评估、税务稽查等方面的工作效率。所述方法包括:使用数据抽取工具从电子底账库和金税三期库中抽取原始数据;使用SPARK对所述原始数据进行数据补全以及清理处理,并按照增值税分析需求形成需求表,并进行数据整合以形成需求数据模型将需求数据模型存储在数据仓库中;使用数据抽取工具将数据仓库中的需求数据模型导入至Greenplum数据库中进行长期存储。

Patent Agency Ranking