一种面向企业行业分类的异常检测方法

    公开(公告)号:CN109657947B

    公开(公告)日:2021-03-16

    申请号:CN201811489291.X

    申请日:2018-12-06

    Abstract: 本发明公开了一种面向企业行业分类的异常检测方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息并进行特征处理和编码处理;其次,构建符合行业分类异常检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用不同的训练策略通过交叉验证分别训练行业大类和行业明细的网络;最后,利用行业大类网络的降维特性融合SOS异常检测算法对行业大类进行异常检测,根据行业明细网络的重构特性对行业明细进行异常检测。本发明利用TADM模型对原始数据做异常检测,可以更加合理、准确地对国家的统计、税收、工商管理等宏观管理工作进行分析。

    一种基于动态网络表征的发票虚开识别方法

    公开(公告)号:CN110852856B

    公开(公告)日:2022-10-25

    申请号:CN201911066791.7

    申请日:2019-11-04

    Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。

    一种基于动态网络表征的发票虚开识别方法

    公开(公告)号:CN110852856A

    公开(公告)日:2020-02-28

    申请号:CN201911066791.7

    申请日:2019-11-04

    Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。

    一种面向企业行业分类的异常检测方法

    公开(公告)号:CN109657947A

    公开(公告)日:2019-04-19

    申请号:CN201811489291.X

    申请日:2018-12-06

    Abstract: 本发明公开了一种面向企业行业分类的异常检测方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息并进行特征处理和编码处理;其次,构建符合行业分类异常检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用不同的训练策略通过交叉验证分别训练行业大类和行业明细的网络;最后,利用行业大类网络的降维特性融合SOS异常检测算法对行业大类进行异常检测,根据行业明细网络的重构特性对行业明细进行异常检测。本发明利用TADM模型对原始数据做异常检测,可以更加合理、准确地对国家的统计、税收、工商管理等宏观管理工作进行分析。

Patent Agency Ranking