基于服务开放平台的服务调用数据统计分析方法及系统

    公开(公告)号:CN111198806B

    公开(公告)日:2024-04-05

    申请号:CN201911300923.8

    申请日:2019-12-17

    Abstract: 本发明公开了一种基于服务开放平台的服务调用数据统计分析方法及系统,所述方法包括:采集服务调用情况数据;采集服务调用情况数据,将以UDP采集方式采集的数据存储在分布式时序数据库中,将以HTTP采集方式采集的数据经分析后数据存入分布式事务数据库中;依据用户输入的关键字查询,若检测到分布式事务数据库的数据满足查询条件,输出分布式事务数据库的查询结果,否则输出分布式时序数据库的查询结果。本发明可以满足多客户端高并发访问平台服务的情况下,服务调用数据存储、查询及统计分析的实时性和准确性,支撑开放平台运营者和服务开发者根据服务调用数据快速决策。

    一种spark计算调度的方法、装置、电子设备及介质

    公开(公告)号:CN117573368A

    公开(公告)日:2024-02-20

    申请号:CN202311753831.1

    申请日:2023-12-19

    Abstract: 本申请实施例提供一种spark计算调度的方法、装置、电子设备及介质,方法包括:分析总体资源情况以及执行spark任务所需的资源情况,并根据总体资源情况以及执行spark任务所需的资源情况确定任务拆分的策略;根据任务拆分的策略,分别对各条spark任务运行所需的资源进行拆分,获得具有不同范围的参数值的spark任务命令;将具有不同范围参数的spark任务命令进行任务调度并编写成脚本,根据业务需要进行脚本的执行。本申请实施例解决了spark计算存储大批量的数据到Hbase时任务执行过慢甚至失败的问题,通过任务拆分的策略,实现计算存储任务在一定资源下可正常运行、高效完成计算和存储。

    一种基于发票数据分析的疑似税务异常企业筛选方法

    公开(公告)号:CN111783577B

    公开(公告)日:2023-11-10

    申请号:CN202010566093.X

    申请日:2020-06-19

    Abstract: 本发明提供一种基于发票数据分析的疑似税务异常企业筛选方法,包括:对发票数据进行特征提取,得到特征向量;修改支持向量机模型,将最小间隔分离超平面设置为分类超平面;将特征向量作为一次修改支持向量机模型训练样本,得到包含正样本和负样本的一类训练样本;采用一类训练样本对一次修改支持向量机模型进行迭代训练,直至将负样本与正样本完全分离;将一次修改支持向量机模型修改为层次型支持向量机模型;采用带有标记的正样本和负样本对二次修改支持向量机模型进行训练,得到所述疑似税务异常企业筛选模型;根据该模型对异常发票进行筛选,确定疑似税务异常企业。与现有基于机器学习的疑似税务异常企业筛选方法相比,本发明的准确率更高。

    调度优化方法及装置
    45.
    发明公开

    公开(公告)号:CN112527486A

    公开(公告)日:2021-03-19

    申请号:CN202011496875.7

    申请日:2020-12-17

    Abstract: 本申请涉及云计算技术领域,提供一种调度优化方法及装置,用以解决节点无法正常创建Pod的问题,其中,方法包括:根据待调度Pod对CPU内存资源的需求,对集群中各个节点进行筛选;根据筛选出的节点的优先级和筛选出的节点的评估值,确定筛选出的节点的综合值;从综合值超过预设阈值的节点中选择作为对待调度Pod进行调度的节点。在本申请实施例中,在满足待调度Pod的静态资源的前提下,还要考虑在节点上成功创建Pod的概率,以避免在节点创建Pod时因Pod沙盒创建失败、Pod同步失败或者其他错误导致无法正常创建Pod。

    一种日志统计方法、装置及系统

    公开(公告)号:CN112463570A

    公开(公告)日:2021-03-09

    申请号:CN202011477819.9

    申请日:2020-12-15

    Abstract: 本发明提供一种日志统计方法、装置及系统,用于解决现有的日志统计方法存在容易出现并发问题影响日志数据正常储存,以及中间统计结果与全量日志数据不一致的技术问题,所述方法应用于日志统计系统,所述日志统计系统包括logstash、kafka以及mysql数据库,所述方法包括:通过所述logstash获取日志数据,将所述日志数据通过所述logstash的kafka output插件输出到所述kafka中;消费存储于所述kafka中的日志数据,并统计已消费日志数据,得到统计结果,将所述统计结果输出到所述mysql数据库中。

    一种用于对进销项商品种类差异进行度量的方法及系统

    公开(公告)号:CN110019798B

    公开(公告)日:2021-02-05

    申请号:CN201711157256.3

    申请日:2017-11-20

    Inventor: 舒南飞 林文辉

    Abstract: 本发明公开了一种用于对进销项商品种类差异进行度量的方法,所述方法包括:根据包含商品和服务明细的历史发票数据与规则集数据建立商品和服务分类编码的分析识别模型;根据预设周期内的商品的发票数据的属性信息利用商品和服务分类编码的分析识别模型,确定商品和服务的以概率降序排列的商品和服务分类的更新列表;根据进销项差异度量公式,按照更新的商品和服务分类的粗细分类程度计算企业的进销项商品的种类差异。本发明能够准确地反应企业的进货和出货商品和服务类别,从而识别出有异常经营行为的企业。同时,通过更正后的商品和服务分类编码对企业进项和销项进行分析,提高了分类的准确度并减小了计算的工作量。

    Reduce任务的调度方法及装置

    公开(公告)号:CN109871265A

    公开(公告)日:2019-06-11

    申请号:CN201711270644.2

    申请日:2017-12-05

    Inventor: 林文辉 舒南飞

    Abstract: 本发明提供一种Reduce任务的调度方法及装置,用以克服现有技术中在进行任务调度时网络传输开销较大、任务调度时间较长的缺陷。其中方法包括:当请求节点申请Reduce任务时,确定各未被调度的Reduce任务的数据本地性衡量值;选取数据本地性衡量值最小的Reduce任务,并确定选取的Reduce任务是否满足调度条件;若满足,则将选取的Reduce任务分配给请求节点。本发明实施例并非直接调度Reduce任务,而是根据Reduce任务的数据本地性衡量值进行判定后再分配满足调度条件的Reduce任务,因此在进行任务调度时考虑了Reduce任务的数据本地性,减少了任务调度时间,提高作业吞吐量。

    非正常纳税人识别方法及装置

    公开(公告)号:CN109858922A

    公开(公告)日:2019-06-07

    申请号:CN201811584029.3

    申请日:2018-12-24

    Abstract: 本发明公开了一种非正常纳税人识别方法及装置,该方法包括:获取待识别纳税人的选定信息;从所述待识别纳税人的选定信息中获取所述待识别纳税人的至少一个选定特征的特征值;将所述待识别纳税人的至少一个选定特征的特征值依次输入第一设定数量的训练后的xgboost模型中,得到所述待识别纳税人的第一设定数量的概率值;基于所述待识别纳税人的第一设定数量的概率值得到所述待识别纳税人的识别结果。该方案可以实现借助机器学习算法和大数据技术,来构建非正常纳税人识别模型来识别纳税人是否正常。

    能力测评报告批量生成和管理系统及方法

    公开(公告)号:CN108615209A

    公开(公告)日:2018-10-02

    申请号:CN201611145106.6

    申请日:2016-12-13

    Inventor: 舒南飞 林文辉

    Abstract: 公开了能力测评报告批量生成和管理系统及方法。系统包括:试题题目选择和分值记录模块,根据设定的评测能力考察需求确定测试领域类型和对应的试题比例,以及在具有所确定的测试领域类型的试题中选择试题;测评报告模板生成模块,根据预设数据信息生成测评报告模板;测评结果生成模块,根据所述测试领域类型和考生所得分数百分比确定试题类型百分比成绩向量,以及生成至少包括所述预设数据信息、所述试题类型百分比成绩向量和结合历次考试情况的能力综合评定的测评结果;以及测评报告批量生成模块,将多个所述测评结果批量导入所述测评报告模板以批量生成测评报告。上述技术方案,能自动化地生成包含考生测评成绩基本信息,能力综合评价以及成绩所体现能力个性化的评语。

Patent Agency Ranking