一种虚拟机磁盘在线迁移去冗余方法

    公开(公告)号:CN111580932A

    公开(公告)日:2020-08-25

    申请号:CN202010397985.1

    申请日:2020-05-12

    Abstract: 本发明公开了一种虚拟机磁盘在线迁移去冗余方法,包括:首先,根据文件系统组织方式,读取磁盘中的超级块,然后根据超级块中的块组描述信息,读取每个块组中的位图,并确定该位图记录块组中的每个块是已用还是可用,利用获取到的所有块组的位图为整个磁盘构建完整的位图;其次,在虚拟机迁移过程中,根据得到的磁盘使用信息进行磁盘迁移,此时只传输已用磁盘块;再次,使用虚拟机自省技术从原始内存数据中提取可能更新过的未使用的块位图,在获取了所有块设备元数据在内存中的缓存后,用其更新位图信息并将之前未迁移的已用磁盘块用现有方法迁移至目的端。本发明主要利用数据自身的语义信息进行数据压缩,从而引入非常小的对上层应用的开销。

    一种面向税务领域知识图谱的构建方法

    公开(公告)号:CN111428053A

    公开(公告)日:2020-07-17

    申请号:CN202010238326.3

    申请日:2020-03-30

    Inventor: 董博 郑庆华 吴琰

    Abstract: 本发明公开了一种面向税务领域知识图谱的构建方法。该构建方法采用自顶向下与自底向上相结合的方式。方法过程如下:首先基于税务专家系统中的税务知识构建税务知识图谱的模式;然后是数据处理,包括税务数据源的选择与获取、数据的清洗等;之后是信息抽取,对处理后的数据根据模式图按照不同的类型进行信息抽取得到;接着是税务知识融合,税务知识图谱中的知识来源不同,存在知识重复、关系冗余等问题需要进行模式匹配、实体对齐等完成知识融合之后存入知识库。最后是知识反馈,利用税务专家系统解决智能税务模型构建中的知识冲突。最终解决了知识图谱与税务场景结合不紧密的问题。

    一种基于动态网络表征的发票虚开识别方法

    公开(公告)号:CN110852856A

    公开(公告)日:2020-02-28

    申请号:CN201911066791.7

    申请日:2019-11-04

    Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。

    一种基于启发式规则的发票货物归类方法

    公开(公告)号:CN106095759B

    公开(公告)日:2019-05-24

    申请号:CN201610446072.8

    申请日:2016-06-20

    Abstract: 本发明公开了一种基于启发式规则的发票货物归类方法,将发票上未规范化的货物名规范到国民经济行业分类中的一个子类,分类结果能够直接反映发票出具企业的经营信息。一方面,与企业注册时的行业代码比对,可以判断所开发票是否合法;另一方面,为企业的纳税风险监控提供了更直观的信息和更细致的监控粒度。通过基于海关历史记录的实例匹配将发票货物名先行归类到海关编码,再通过人工建立海关编码到国民经济行业分类代码的映射关系,最终得到发票的国民经济行业分类代码。从而解决分类实例匮乏情况下从海量未规范化的发票货物名到国民经济行业分类的归类问题,为后续的税务分析和风险监控奠定基础。

    一种面向企业行业分类的异常检测方法

    公开(公告)号:CN109657947A

    公开(公告)日:2019-04-19

    申请号:CN201811489291.X

    申请日:2018-12-06

    Abstract: 本发明公开了一种面向企业行业分类的异常检测方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息并进行特征处理和编码处理;其次,构建符合行业分类异常检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用不同的训练策略通过交叉验证分别训练行业大类和行业明细的网络;最后,利用行业大类网络的降维特性融合SOS异常检测算法对行业大类进行异常检测,根据行业明细网络的重构特性对行业明细进行异常检测。本发明利用TADM模型对原始数据做异常检测,可以更加合理、准确地对国家的统计、税收、工商管理等宏观管理工作进行分析。

    一种用户服务高可用的Docker与虚拟机聚合放置方法

    公开(公告)号:CN109445907A

    公开(公告)日:2019-03-08

    申请号:CN201811190208.9

    申请日:2018-10-12

    Abstract: 本发明公开了一种用户服务高可用的Docker与虚拟机聚合放置方法,包括以下内容:首先,以服务器节点独立作为用户服务多副本分布的前提条件建立DVP(Docker-VM-PM)三层架构环境下的用户服务高可用DVMP(Docker and Virtual Machine Placement,Docker与VM放置)约束模型;其次,在此基础上增加容器副本冗余部署的约束条件,建立用户服务高可用的Docker与虚拟机聚合放置模型;然后,构建高可用的Docker与虚拟机聚合放置方案;最后,提出“宕机”模拟的服务容错能力评价方法及服务容错度计算模型对放置方案进行评价。本发明提出的方法能大幅度提升用户服务容错能力,实现节能与用户服务的高可用目标。

    一种面向新设立企业的纳税风险预测方法

    公开(公告)号:CN109242664A

    公开(公告)日:2019-01-18

    申请号:CN201811203365.9

    申请日:2018-10-16

    Abstract: 本发明公开了一种面向新设立企业的纳税风险预测方法,包括以下步骤:首先,基于关联自然人与企业之间的关联关系和企业之间的经济行为,构建出表征企业之间投资关系、控股关系、交易关系以及董事会互锁关系的纳税人影响关系网络;其次,对于纳税人影响关系网络中的非新设立企业,基于其档案资料、纳税申报资料、财务会计报表,利用机器学习回归算法得到纳税风险值;再次,对于纳税人影响关系中的新设立企业,基于其与周围邻居企业的影响关系、邻居企业中非新设立企业的纳税风险值,进行网络特征构建;最后,结合新设立企业的网络特征和档案资料,利用机器学习回归算法进行纳税风险预测。本发明使得新设立企业能够有效进行纳税风险预测。

    基于纳税人利益关联网络的关联交易偷漏税行为识别方法

    公开(公告)号:CN106294834B

    公开(公告)日:2018-04-17

    申请号:CN201610685907.5

    申请日:2016-08-18

    Abstract: 本发明公开了一种基于纳税人利益关联网络的关联交易偷漏税行为识别方法,包括以下步骤:构建纳税人利益关联网络;对于控制关系、投资关系进行合并,构建由控制关系、投资关系组成的可达路径集合,并基于税率差异对交易关系进行约简,匹配关联交易行为模式,获取具有关联交易行为的纳税人群组;构建纳税人月度交易网络;计算纳税人的税负指标,和行业预警值对比,判断税负指标异常;对关联交易模式匹配结果进行税负异常的分析,得到存在税负指标异常的嫌疑群组。从而解决了关联交易偷漏税行为识别效率低、与税务场景结合不紧密、判断结果可靠性差的问题。

    一种结合纳税信用等级和交易关系网络的税务稽查方法

    公开(公告)号:CN106447482B

    公开(公告)日:2017-12-15

    申请号:CN201610828358.2

    申请日:2016-09-18

    Abstract: 本发明公开了一种结合纳税信用等级和交易关系网络的税务稽查方法,包括以下步骤:1)构建有向加权的交易关系网络;2)基于纳税信用等级和交易关系网络,通过纳税嫌疑的分裂、传递、组合三阶段步骤的迭代,以及加权平均得到纳税人的纳税嫌疑评分;3)基于纳税嫌疑评分排序得到有待税务稽查的问题纳税人。该方法综合纳税信用等级与交易关系网络信息,为税务稽查提供更具综合性的选案方法,克服了将纳税信用等级直接作为税务稽查选案参考指标时的片面性——仅考虑了纳税人的静态指标和历史违法违规行为,无法综合交易过程中的实时交易信息。

    一种基于Spark的纳税人利益关联网络并行生成方法

    公开(公告)号:CN105574761B

    公开(公告)日:2016-11-30

    申请号:CN201510924355.4

    申请日:2015-12-11

    Abstract: 一种基于Spark的纳税人利益关联网络并行生成方法,包括以下步骤:1)、从原始数据中构造纳税人利益关联初始网络TPIN0;所述的原始数据包括企业的工商局注册信息、证监会上市公司信息、户籍部门的信息、金融机构披露的信息以及税务部门的电子发票信息;2)、使用多种聚合算子对TPIN0进行约简,得到TPIN;3)、并行输出纳税人利益关联网络TPIN0。本发明提出的并行生成方法具有高效率、可扩展的特点,为后续基于纳税人利益关联网络的税务指标挖掘和图分析的并行化奠定了基础,能用以应对海量异构的涉税数据的TPIN生成。

Patent Agency Ranking