-
公开(公告)号:CN111585997A
公开(公告)日:2020-08-25
申请号:CN202010344517.8
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于少量标注数据的网络流量异常检测方法,采用双自编码器对特征向量进行降维处理,然后使用深度神经网络进行有监督的训练;将网络流量分成正样本和负样本的两类,最后筛选出无标注数据中部分重要样本,交由专家进行标注,增加有标记样本数量,迭代更新自编码器和分类器,之后用训练好的分类器进行网络流量异常检测。本发明提出双自编码器架构,使用纯净的正负样本分别训练自编码器,提升了分类器的稳定性。同时改进深度神经网络的损失函数,更细粒度地调整样本权重,解决正负样本不平衡,缓解训练集较小导致的过拟合问题,并提出一种新的计算无标注数据的标记价值的方法,选择标记价值高的样本交由专家,减少了标注成本。
-
公开(公告)号:CN111585997B
公开(公告)日:2022-01-14
申请号:CN202010344517.8
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于少量标注数据的网络流量异常检测方法,采用双自编码器对特征向量进行降维处理,然后使用深度神经网络进行有监督的训练;将网络流量分成正样本和负样本的两类,最后筛选出无标注数据中部分重要样本,交由专家进行标注,增加有标记样本数量,迭代更新自编码器和分类器,之后用训练好的分类器进行网络流量异常检测。本发明提出双自编码器架构,使用纯净的正负样本分别训练自编码器,提升了分类器的稳定性。同时改进深度神经网络的损失函数,更细粒度地调整样本权重,解决正负样本不平衡,缓解训练集较小导致的过拟合问题,并提出一种新的计算无标注数据的标记价值的方法,选择标记价值高的样本交由专家,减少了标注成本。
-
公开(公告)号:CN110659022B
公开(公告)日:2020-09-04
申请号:CN201910765411.2
申请日:2019-08-19
Applicant: 浙江邦盛科技有限公司
IPC: G06F8/30
Abstract: 本发明公开了一种基于Java自动调用Python脚本的方法,使用java自动启动、关闭python service端。java通过http访问来调用python文件,python文件可集成所有需要调用的python脚本。同时java自动封装好参数调用对应的python脚本并自动注入函数参数。本发明可自管理所有的python进程,负载均衡。本发明方法能够兼容各个python版本,能够通过配置调用所有的python脚本及里面的函数,不需要修改代码,上手简单,部署方便,不需要额外的web容器。
-
公开(公告)号:CN111461216A
公开(公告)日:2020-07-28
申请号:CN202010244378.1
申请日:2020-03-31
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于机器学习的案件风险识别方法,首先对案件进行分析,提取出有效案件特征列表,并利用随机欠采样的方式抽取白样本,平衡数据中的黑白样本比;然后基于交易流水、账户基本信息、客户基本信息等数据加工特征宽表,并基于特征宽表对随机森林算法进行训练,提取能够有效区分黑白样本的重要特征列表。最后基于重要特征宽表对随机森林算法进行训练与预测,得到最终可疑的账户集合,并针对可疑账户进行核查验证。本发明首次将机器学习有监督算法应用于小样本银行案件风险场景,不仅能够准确识别风险账户,还能够解析出有效的规则,为银行案件风险场景下的规则制定和防控思路提供参考依据。
-
公开(公告)号:CN111105043A
公开(公告)日:2020-05-05
申请号:CN201911321039.2
申请日:2019-12-19
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种基于指标维度实施银行业案件和操作风险防控的方法,该方法利用专家经验对银行业案件或者操作风险事件进行研究,还原风险场景,提炼风险特征,并回溯业务流程中的操作缺陷和管理漏洞,然后解析风险规则,生成相关指标。指标进而用于规则配置、风险画像、机器学习模型训练和智能规则输出。本发明首次将指标用于银行的案防领域,实现对具有相关风险特征的账户、可疑的交易或者异常的业务操作进行监控、画像和预警。
-
公开(公告)号:CN109948007A
公开(公告)日:2019-06-28
申请号:CN201910219682.8
申请日:2019-03-21
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/9035 , G06Q40/04
Abstract: 本发明公开了一种对时序数据统计最大连续递增次数与递增次数的处理方法,本发明预先对数据序列分组,然后计算每个分组的最大连续递增与递减次数、首元素、尾元素、从首元素开始的连续递增与递减次数、以尾元素为止的连续递增与递减次数及每个分组的元素个数,把中间结果存储在相应时间戳上,查询时根据指定时间戳快速得到计算结果;由于只存储计算后的中间结果,内存耗费降低,存储效率提高,因为提前计算好了中间结果,所以在查询时响应速度极快;最为重要的是,这部分结果跟着系统时间移动而不断变化,能够达到时间窗口平滑移动的目的。本发明适用于时序数据处理技术等数据分析领域,能够显著提升计算时序数据最大连续递增与递减次数的速度。
-
公开(公告)号:CN108681936A
公开(公告)日:2018-10-19
申请号:CN201810382121.5
申请日:2018-04-26
Applicant: 浙江邦盛科技有限公司
CPC classification number: G06Q30/0609
Abstract: 本发明公开了一种基于模块度和平衡标签传播的欺诈团伙识别方法,包括:利用ID特征结合用户自身已知的欺诈标识,对所有用户计算两两相似度,建立相似度矩阵,通过相似度矩阵建立关联图;对建立的图运行Louvain算法得出每个节点所属的社区及层级信息;以每个节点所属的社区、层级信息及欺诈标识作为每个节点初始的社区信息,运行平衡标签传播过程得到每个节点最终所属社区,再根据是否归属共同社区划分网络,根据传播获得的欺诈标识划分欺诈团伙。本发明首次将基于模块度和平衡标签传播的欺诈团伙识别方法应用到申请反欺诈和交易反欺诈领域,利用交易关联等信息构建关联图谱,综合社团模块度信息,利用平衡标签传播算法检测欺诈社团,防范潜在欺诈交易。
-
公开(公告)号:CN113434547A
公开(公告)日:2021-09-24
申请号:CN202110703269.6
申请日:2021-06-24
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/2455 , G06F16/27
Abstract: 本发明公开了一种毫秒级时序流数据精准切片方法。该方法分为四个部分:精准切片的创建、精准切片的聚合、聚合数据的持久化存储和毫秒级切片的查询。首先对时序流数据的处理,包括毫秒级精准切片的创建以及毫秒级精准切片内聚合计算和存储,其次是对时序流数据的查询。本发明提出的毫秒级时序流数据精准切片方法能够在毫秒级时间范围内精准地实时处理用户流式数据,利用不同时序下的切片聚合技术提升系统吞吐量和应对海量数据的高可用性,并根据时间局部性原则将切片聚合数据存入分布式数据库从而高效利用内存空间,最后优化设计了针对时序流数据的查询接口。
-
公开(公告)号:CN113268545A
公开(公告)日:2021-08-17
申请号:CN202110619958.9
申请日:2021-06-03
Applicant: 浙江邦盛科技有限公司
Abstract: 本发明公开了一种增量合并与全量相结合的集群节点间键值数据异步复制方法,该处理方法主要分为五个部分:键值数据复制操作类型的定义、键值对修改请求的合并、增量数据的复制、全量复制的探测和全量复制。本发明键值数据异步复制方法使用异步复制机制保证了数据复制的高吞吐和低延迟,使用版本号进度追踪的机制探测是否需要执行全量复制,并使用请求合并和全量复制的机制降低数据复制带来的网络带宽开销,默认情况下为增量复制,即复制合并后的指标修改请求,但当备节点数据新旧程度远远落后于主节点,主节点会触发全量复制,将本地保存的数据复制到备节点上,从而降低了追赶时间。
-
公开(公告)号:CN111984861A
公开(公告)日:2020-11-24
申请号:CN202010754365.9
申请日:2020-07-30
Applicant: 浙江邦盛科技有限公司
IPC: G06F16/9535 , G06F16/951 , G06F16/2457
Abstract: 本发明公开了一种时序数据的复杂事件处理方法及系统,首先定义复杂事件模式,包括复杂事件标签序列和相邻标签间的时间距离限定,获取到事件的标签和时间戳后,读取计算机存储器中的中间结果并进行归并处理,最后进行复杂事件判定,查询的判定结果不仅包括复杂事件是否触发,还包括触发次数。本发明克服了现有技术方案中耗时长、效率低的缺陷,能快速地进行海量时序数据的复杂事件处理,另外,本发明提前计算好了中间结果,所以在查询时避免了大量无用的计算机重复运算,响应速度极快;此外,中间结果是跟着系统时间移动而不断变化的,能够达到时间窗口平滑移动的目的。本发明能够显著提升时序数据的复杂事件处理的效率。
-
-
-
-
-
-
-
-
-