-
公开(公告)号:CN111585997A
公开(公告)日:2020-08-25
申请号:CN202010344517.8
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于少量标注数据的网络流量异常检测方法,采用双自编码器对特征向量进行降维处理,然后使用深度神经网络进行有监督的训练;将网络流量分成正样本和负样本的两类,最后筛选出无标注数据中部分重要样本,交由专家进行标注,增加有标记样本数量,迭代更新自编码器和分类器,之后用训练好的分类器进行网络流量异常检测。本发明提出双自编码器架构,使用纯净的正负样本分别训练自编码器,提升了分类器的稳定性。同时改进深度神经网络的损失函数,更细粒度地调整样本权重,解决正负样本不平衡,缓解训练集较小导致的过拟合问题,并提出一种新的计算无标注数据的标记价值的方法,选择标记价值高的样本交由专家,减少了标注成本。
-
公开(公告)号:CN111585997B
公开(公告)日:2022-01-14
申请号:CN202010344517.8
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于少量标注数据的网络流量异常检测方法,采用双自编码器对特征向量进行降维处理,然后使用深度神经网络进行有监督的训练;将网络流量分成正样本和负样本的两类,最后筛选出无标注数据中部分重要样本,交由专家进行标注,增加有标记样本数量,迭代更新自编码器和分类器,之后用训练好的分类器进行网络流量异常检测。本发明提出双自编码器架构,使用纯净的正负样本分别训练自编码器,提升了分类器的稳定性。同时改进深度神经网络的损失函数,更细粒度地调整样本权重,解决正负样本不平衡,缓解训练集较小导致的过拟合问题,并提出一种新的计算无标注数据的标记价值的方法,选择标记价值高的样本交由专家,减少了标注成本。
-
公开(公告)号:CN110083609B
公开(公告)日:2021-06-08
申请号:CN201910350630.4
申请日:2019-04-28
Applicant: 浙江邦盛科技有限公司 , 中车唐山机车车辆有限公司
IPC: G06F16/22 , G06F16/242 , G06F16/2458 , G06F16/29
Abstract: 本发明公开了一种轨道交通网络客流数据中图结构数据的实时查询方法,对带有属性和标签的数据图进行基于跳数的分区,并建立相关索引;输入查询图,计算查询图的半径并选取查询起始点;生成查询图的查询序列;在各个分区内根据查询图的查询起始点的特征过滤出满足条件的数据图的查询起始点;进行级联式的图查询过程;收集所有分区的查询结果,完成分布式图查询过程。本发明在跨分区查询过程中传输查询图而不传输数据图,进而减少了数据传输量;级联查询过程基于起始点而不在整个数据图范围内进行,进而大幅降低了查询范围;采用异步并发和查询时结果集检测,能够最大化查询效率,从而能够满足轨道交通网络客流数据中图结构数据的实时查询处理需求。
-
公开(公告)号:CN111737538A
公开(公告)日:2020-10-02
申请号:CN202010750714.X
申请日:2020-07-30
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/901 , G06F16/9035
Abstract: 本发明公开了一种基于事件驱动的图模式逆向实时匹配方法,该方法包括图模式的定义、逆向匹配架构的建立和逆向匹配方法;图模式用于以逆向顺序描述图中顶点和边的空间连接关系及其属性约束,包括匹配步骤链表和匹配上下文,依据逆向匹配架构实现图模式逆向实时匹配,解决实时场景下基于事件驱动的子图匹配的问题。本发明可以在秒级完成固定顶点子图匹配问题,并且实现了性能和准确率的有效平衡,支持大量图模式并发匹配,可用于增强现有的图计算引擎,支持包括金融、电商、物流、公安等领域的实时图匹配和查询分析等场景。
-
公开(公告)号:CN110362572A
公开(公告)日:2019-10-22
申请号:CN201910554845.8
申请日:2019-06-25
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种基于列式存储的时序数据库系统,包括SQL解析器:将SQL通过解析转换为抽象语法树;逻辑计划生成器:利用抽象语法树生成逻辑查询计划,逻辑查询计划由关系代数表示;查询优化器:利用数据库的状态信息进行查询计划的优化,输出改写后的查询计划;执行器:以块迭代方式执行查询计划,负责与存储层进行交互,获取用户查询的数据;存储引擎:以行+列的方式存储数据。本发明采用列方式存储数据库中的数据,并基于列存储与rocksdb的结合实现了高速插入数据特性与传统数据库的索引功能,在执行器方面,改进了部分算子以与存储引擎的特性深度结合,同时利用现代处理器的新特性为查询加速。
-
公开(公告)号:CN108765127A
公开(公告)日:2018-11-06
申请号:CN201810382123.4
申请日:2018-04-26
Applicant: 浙江邦盛科技有限公司
IPC: G06Q40/02
CPC classification number: G06Q40/025
Abstract: 本发明公开了一种基于蒙特卡罗搜索的信用评分卡特征选择方法,包括:在信用风险评级场景,获得信用评分特征数据;初始化蒙特卡罗搜索树;选择未被完全扩展节点,使用偏回归平方和指标进行复合策略扩展;在扩展后的树结构基础上,在随机模拟策略中引入偏回归平方和划定随机选择域,生成模拟路径;基于每一条路径所选择的特征分别使用交叉验证方法进行逻辑回归建模,并计算相关统计量;基于UCB公式选择最佳路径。采用本发明提出的信用评分卡特征选择方法,可以极大地提升信用评分卡的建模效果,保证信用评分卡的建模特征最优,从根本上自动化信用评分卡构建的特征选择过程,可以广泛应用在信用风险控制领域。
-
公开(公告)号:CN107563884A
公开(公告)日:2018-01-09
申请号:CN201710633146.3
申请日:2017-07-28
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种降低资产损失率的方法。该方法能根据疑似欺诈交易金额的不同,智能调整欺诈检测的阈值。当疑似欺诈交易金额比较大的时候,更加谨慎地判断该笔交易存在欺诈的可能,而对于疑似欺诈金额比较小的交易,智能调节阈值,合理降低报警率,节省人工核对成本。这样,可以让企业将因欺诈而产生的资产损失降到最低,而不是仅仅提升识别欺诈的覆盖率。本发明不依赖特定的风险控制系统,故该方法具有很好的移植性,简明易懂,容易实现。
-
公开(公告)号:CN108681936B
公开(公告)日:2021-11-02
申请号:CN201810382121.5
申请日:2018-04-26
Applicant: 浙江邦盛科技有限公司
IPC: G06Q30/06 , G06F16/2458
Abstract: 本发明公开了一种基于模块度和平衡标签传播的欺诈团伙识别方法,包括:利用ID特征结合用户自身已知的欺诈标识,对所有用户计算两两相似度,建立相似度矩阵,通过相似度矩阵建立关联图;对建立的图运行Louvain算法得出每个节点所属的社区及层级信息;以每个节点所属的社区、层级信息及欺诈标识作为每个节点初始的社区信息,运行平衡标签传播过程得到每个节点最终所属社区,再根据是否归属共同社区划分网络,根据传播获得的欺诈标识划分欺诈团伙。本发明首次将基于模块度和平衡标签传播的欺诈团伙识别方法应用到申请反欺诈和交易反欺诈领域,利用交易关联等信息构建关联图谱,综合社团模块度信息,利用平衡标签传播算法检测欺诈社团,防范潜在欺诈交易。
-
公开(公告)号:CN110096520A
公开(公告)日:2019-08-06
申请号:CN201910350049.2
申请日:2019-04-28
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/2455
Abstract: 本发明公开了一种用于轨道交通多源流数据的分布式实时处理方法,该方法包括多源流数据的合并和合并后流数据的分布式处理两部分;多源流数据的合并首先对同一轨道线路上同一车辆的实时数据进行维度上的合并,对维度合并后得到的新流进行广度上的合并;合并后流数据的分布式处理在分布式系统上实现,分布式系统拥有两种类型的Manager,分别为JobManager以及TaskManager;设置多个JobManager;本发明具有一定的伸缩度,且整个架构的伸缩不会降低或增加整体的流处理计算量;本发明拥有性能高的特点;本发明在进行分布式处理时,采用了分布式多JobManager状态同步的方式实现了完全的分布式处理。
-
公开(公告)号:CN106682067A
公开(公告)日:2017-05-17
申请号:CN201610981804.3
申请日:2016-11-08
Applicant: 浙江邦盛科技有限公司
CPC classification number: G06F17/30563 , G06F17/30303 , G06Q40/04
Abstract: 本发明公开了一种基于交易数据的机器学习反欺诈监测系统,包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎;流处理引擎通过流式大数据处理对庞大的交易原始数据进行特征的快速提取和计算,从海量原始数据中得到有代表性的特征,充分提取数据中的信息。模型训练模块使用多种针对资金损失率、黑样本查全率优化过的机器学习模型和集成学习框架,得到的是针对某个指标优化的复合模型,克服了单个模型带来的过拟合、不稳定的缺陷,提高了模型的稳定性和泛化能力;模型训练模块通过预先设置的更新时间,自动获取最新数据并重新训练模型,从而使模型始终保持有效性,避免欺诈变异带来的模型失效问题。
-
-
-
-
-
-
-
-
-