提取税务系统典型测试用例的方法及系统

    公开(公告)号:CN105701007A

    公开(公告)日:2016-06-22

    申请号:CN201410714228.7

    申请日:2014-11-28

    Abstract: 本发明公开一种提取税务系统典型测试用例的方法,包括:确定测试样本最终的数量;获得原始数据中的关键信息,以确定输入数据的维度,并将这些信息进行归一化处理;以及设置SOM学习参数,初始化利用SOM算法进行反复迭代计算,直到稳定,以获得稳定后的神经元,并选取与各个神经元欧几里得距离最小的样本点作为最终的测试样本。本发明还提供了一种提取税务系统典型测试用例的系统。所述提取税务系统典型测试用例的方法及系统可覆盖广泛且真实。

    一种基于分布式系统基础架构平台对税务数据进行处理的方法及系统

    公开(公告)号:CN110019453A

    公开(公告)日:2019-07-16

    申请号:CN201710979600.0

    申请日:2017-10-19

    Abstract: 本发明公开了一种基于分布式系统基础架构平台对税务数据进行处理的方法,所述方法包括:将税务数据存储至分布式文件系统;将所述税务数据分为动态税务数据和静态税务数据;采集所述动态税务数据,对采集的所述动态税务数据进行实时处理;将所述动态税务数据存储至第一数据库,将所述静态税务数据存储至第二数据库;对所述税务数据进行清洗转换,包括对所述税务数据进行统一处理,以及将不完整的所述税务数据补充完整;对所述静态税务数据进行挖掘和分析;对所述动态税务数据进行流式处理。本申请通过大数据平台的构建,使得海量税务数据能够进行统一管理,并在此基础上进行数据的处理分析,有效实现了税务数据的应用。

    一种通过详见销货清单来监控企业虚开发票的方法和系统

    公开(公告)号:CN108269134A

    公开(公告)日:2018-07-10

    申请号:CN201611246545.6

    申请日:2016-12-29

    Abstract: 本发明涉及一种通过详见销货清单来监控企业虚开发票的方法和系统,所述方法包括:步骤1、获取发票信息数据库中的发票数据,使用sparkSQL进行计算,形成进项发票表和销项发票表以及ETL进项发票明细表和销项发票明细表,并存入数据仓库;步骤3、获取纳税人信息数据库中的纳税人信息以形成纳税人维表;步骤4、对ETL进项发票表和销项发票表进行查询,以获取物品名称为详见销货清单的发票代码和发票号码;步骤5、通过发票代码和发票号码组合形成的关键字KEY去查询ETL进项发票明细表和销项发票明细表,筛选出所述发票明细表中物品名称为详见销货清单的纳税人识别号;以及步骤6、根据步骤5筛选出的纳税人识别号来关联纳税人维表,确定疑点纳税人信息。

    基于Sqoop的数据传输方法、装置、计算机可读存储介质及设备

    公开(公告)号:CN110019558A

    公开(公告)日:2019-07-16

    申请号:CN201711450704.9

    申请日:2017-12-27

    Abstract: 本申请实施例提供了一种基于Sqoop的数据传输方法、装置、计算机可读存储介质及设备,其中,基于Sqoop的数据传输方法包括:在利用Sqoop将Oracle数据库的数据导入Hive数据库的过程中,设置Sqoop中的并行度参数-m大于1;判断Oracle数据库的源表中是否存在用于均匀对列进行切分的主键;若不存在所述主键,利用Oracle数据库中的rownum,通过子查询语句生成rownum列,并对rownum进行数据的切分;Sqoop将单个查询导入语句,按照切分结果生成对应的多个查询语句,均匀地分布到各个机器节点上运行,最后进行合并操作。通过本申请实施例,大大提高了数据的导入速度。

Patent Agency Ranking