-
公开(公告)号:CN106686264A
公开(公告)日:2017-05-17
申请号:CN201610965273.9
申请日:2016-11-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/436
Abstract: 本发明属于电信中有害电话监控技术领域,尤其是涉及一种诈骗电话筛选分析方法及系统。本发明的系统利用诈骗电话分析模型对历史数据进行分析,确定模型各特征权重值;对实时数据进行分析检测,检测结果与设定阈值比较给出诈骗电话的置信度。整个系统由数据查询管理系统、实时检测系统、模型自学习系统、趋势预测系统、数据存储系统组成。数据查询管理系统提供全量话单查询、诈骗话单查询、模型参数管理、自学习管理、趋势预测分析功能。实时检测系统通过诈骗电话发现模型实时分析、检测话单数据,发现诈骗电话。模型自学习系统对历史话单数据分析,通过自学习算法不断优化模型参数。趋势预测系统提供对未来诈骗电话趋势和变化进行预测。数据存储系统采用分布式存储系统,大数据分析处理引擎为整个系统提供快速数据抓取、数据分发、数据查询功能。
-
公开(公告)号:CN109492026B
公开(公告)日:2021-11-09
申请号:CN201811301410.4
申请日:2018-11-02
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2458 , G06Q50/30
Abstract: 本发明公开了一种基于改进的主动学习技术的电信欺诈分类检测方法,涉及一种基于改进的主动学习技术的电信欺诈分类检测方法。抽取数量为X的数据划分训练集和测试集。从训练集中抽取样本作为初始训练集,其余为未标记样本。若当前训练集中正类与负类样本数量的比值不小于阈值e,训练有监督分类器f并构造强组合分类器F;将未标记样本逐个放入有监督分类器f中进行类别评分,得到类别评分结果,输入主动学习采样算法,得到信息量大小的评分。选取信息量最大的前D个进行标注,并加入训练集中;当前训练集样本数量大于等于X1,或者迭代次数大于等于C时结束,输出训练好的分类器f。本发明具有较强的稳定性和鲁棒性,实现较高的分类和检测效率。
-
公开(公告)号:CN109587350B
公开(公告)日:2021-06-22
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2458 , H04W12/12 , H04M3/22
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K‑Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K‑Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
公开(公告)号:CN112990763A
公开(公告)日:2021-06-18
申请号:CN202110406076.4
申请日:2021-04-15
Applicant: 国家计算机网络与信息安全管理中心山东分中心
IPC: G06Q10/06
Abstract: 本发明特别涉及一种多级指标体系。该多级指标体系,包括指标层级判断模块,内侧计算模块,迭代次数执行判断模块,外侧计算模块和指数存储模块;内侧计算模块按照指标体系从内到外依次计算上一层级的指标要素得分;外侧计算模块综合所有层级的指标要素得分,计算指标体系的综合指数K。该多级指标体系,综合考虑指标体系中各层级指标要素的得分情况,以最后一级细分指标要素得分为主,其他层级指标要素得分为辅的计算方式,克服了多数情况下指标体系指数计算仅通过最后一级指标体系来进行确定的弊端;同时,在各级指标要素计算中,采用取对数或开根号的计算方式来对指标要素评分进行降噪处理,保障和提升了指数计算的合理性。
-
公开(公告)号:CN114629714B
公开(公告)日:2023-08-04
申请号:CN202210319190.8
申请日:2022-03-29
Applicant: 济南大学 , 国家计算机网络与信息安全管理中心山东分中心
Abstract: 本发明公开了蜜罐和沙箱相互增强的恶意程序行为处理方法及系统,蜜罐对恶意代码进行诱导捕获;将捕获的恶意代码及产生的信息发送给沙箱;沙箱生成代码运行环境配置文件;沙箱根据恶意代码运行环境配置文件,生成恶意代码运行环境;在恶意代码运行环境中,沙箱触发恶意代码的运行分析恶意代码的运行过程;沙箱对运行过程中的网络通信行为进行分析,并将网络通信行为发送给蜜罐和虚拟网络;蜜罐接收网络通信行为后,对已知网络通信行为进行交互,对未知网络通信行为通过记录沙箱与虚拟网络的交互过程进行学习提升捕获能力;学习过后的蜜罐,重新对恶意代码进行诱导捕获。使蜜罐更高效的捕获恶意样本以及使沙箱更高效安全的分析恶意样本。
-
公开(公告)号:CN114629714A
公开(公告)日:2022-06-14
申请号:CN202210319190.8
申请日:2022-03-29
Applicant: 济南大学 , 国家计算机网络与信息安全管理中心山东分中心
Abstract: 本发明公开了蜜罐和沙箱相互增强的恶意程序行为处理方法及系统,蜜罐对恶意代码进行诱导捕获;将捕获的恶意代码及产生的信息发送给沙箱;沙箱生成代码运行环境配置文件;沙箱根据恶意代码运行环境配置文件,生成恶意代码运行环境;在恶意代码运行环境中,沙箱触发恶意代码的运行分析恶意代码的运行过程;沙箱对运行过程中的网络通信行为进行分析,并将网络通信行为发送给蜜罐和虚拟网络;蜜罐接收网络通信行为后,对已知网络通信行为进行交互,对未知网络通信行为通过记录沙箱与虚拟网络的交互过程进行学习提升捕获能力;学习过后的蜜罐,重新对恶意代码进行诱导捕获。使蜜罐更高效的捕获恶意样本以及使沙箱更高效安全的分析恶意样本。
-
公开(公告)号:CN108460772B
公开(公告)日:2022-05-17
申请号:CN201810150076.0
申请日:2018-02-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06T7/11 , G06T7/136 , G06T7/155 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种基于卷积神经网络的广告骚扰传真图像检测系统及方法,包括关键字区域提取模块,所述关键字区域提取模块用于确定待检测传真图像的关键字可疑区域;神经网络置信度分析模块,所述神经网络置信度分析模块与所述关键字区域提取模块相连,所述神经网络置信度分析模块用于对所述关键字可疑区域的文字进行识别,实现传真图像的分类。本发明通过关键字区域提取模块对关键字可疑区域进行提取,自动化运行,工作效率高;通过神经网络置信度分析模块对关键字可疑区域的文字进行识别,实现广告骚扰传真的分类判断,节约时间,管控能力强,使得本发明具有工作效率高,管控能力强的特点。
-
公开(公告)号:CN109920406B
公开(公告)日:2021-12-03
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
公开(公告)号:CN109587350A
公开(公告)日:2019-04-05
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/22 , H04W12/12 , H04W16/22 , G06F16/2458
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
公开(公告)号:CN109274836A
公开(公告)日:2019-01-25
申请号:CN201811287123.2
申请日:2018-10-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种大规模数据流中电信欺诈风险识别方法,属于数据挖掘与机器学习和商务智能等领域。从呼叫记录数据库中筛选高风险被叫用户和主叫用户作为分析对象,构建欺诈被叫索引数据库,提取各个索引对应的显著特征;采用二级级联分类模型,得到每个被叫号码的攻击风险值;保留每个高风险被叫号码最近的滑动窗口异常得分的最大值,作为各自的序列风险值;构造被叫号码与主叫号码的通联关系二部图,计算每个被叫号码的通联风险值;借助逻辑回归模型,对每个被叫号码的攻击风险、序列风险和通联风险进行融合,得出每个被叫号码各自的综合风险值。本发明最终的综合风险值具有较高的稳定性和可解释性,实现较高的分类和检测效率。
-
-
-
-
-
-
-
-
-