-
公开(公告)号:CN113742478A
公开(公告)日:2021-12-03
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN113205801A
公开(公告)日:2021-08-03
申请号:CN202110498059.8
申请日:2021-05-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本申请涉及一种恶意语音样本的确定方法、装置、计算机设备和存储介质。该方法包括:获取初始语音样本集;根据预设的多种恶意类别对初始语音样本集进行分类,得到多种恶意类别中每种恶意类别对应的语音样本子集;根据每种恶意类别对应的语音样本子集中的语音样本信息,计算每种恶意类别对应的语音样本子集的恶意度;将恶意度满足预设恶意度条件的恶意类别对应的语音样本子集中的语音样本,确定为恶意语音样本。本方法基于语音样本子集的恶意类别以及恶意度可自动确定恶意语音样本,有利于提高恶意语音样本的确定效率。
-
公开(公告)号:CN110175221B
公开(公告)日:2021-04-20
申请号:CN201910411018.3
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06F16/33 , G06F40/289 , G06N3/04
Abstract: 利用词向量结合机器学习的垃圾短信识别方法,所述方法包括下列操作步骤:(1)根据短信特征对垃圾短信进行第一步识别;(2)根据关键词对垃圾短信进行第二步识别;(3)计算短信的短信文本向量,使用支持向量机的方法对垃圾短信进行第三步识别;(4)计算短信的静态词向量矩阵,利用卷积神经网络对垃圾短信进行第四步识别;(5)计算短信的每一个分词的动态词向量,利用卷积神经网络对垃圾短信进行第五步识别。本发明方法采用无监督和有监督相结合的垃圾短信识别方法,能大幅度提高垃圾短信的识别准确率。
-
公开(公告)号:CN108834148B
公开(公告)日:2021-02-26
申请号:CN201810433168.X
申请日:2018-05-08
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: H04W12/128 , H04M3/436 , H04L12/24 , G06F9/455
Abstract: 一种面向5G的基于NFV的诈骗电话处置系统和方法,包含虚拟化诈骗电话处置服务器VSCS,VSCS包含有:AS‑VDU装置,接收电信网发送来的呼叫消息,从策略中提取多条处置规则,然后按优先级由高到低的顺序,顺序执行每条处置规则,并控制MS‑VDU装置对呼叫进行辅助检查,以识别呼叫中的主叫号码是否是非法号码,如果是,则按处置规则进行处置,将相关数据发送给管理Portal服务器;MS‑VDU装置,辅助AS‑VDU装置对呼叫进行检查。本发明属于通信领域,能升级面向NFV架构的诈骗电话处置系统,集NFV管理与业务管理功能于一体,从而满足未来5G方向的功能需要,实现虚拟化功能与业务管理功能的实时便捷管理。
-
公开(公告)号:CN110213724B
公开(公告)日:2020-10-20
申请号:CN201910412262.1
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
Abstract: 一种伪基站运动轨迹的识别方法,包括:从数据库中提取一段时长内的所有切换事件信令,计算每个基站在一定时间周期内的切换事件指标,并识别出疑似受伪基站设备影响的异常基站,将异常基站信息保存在异常基站识别记录表中,同时构建伪基站信息表;分别计算异常基站识别记录表中每个异常基站和伪基站信息表中每个基站之间的位置距离和发现时间差,获得异常基站识别记录表中每个异常基站的轨迹编号,然后将获得轨迹编号的异常基站信息写入伪基站信息表;根据伪基站信息表中基站的位置、发现时间和轨迹编号,获得每个伪基站的运动轨迹。本发明属于信息技术领域,能通过识别受伪基站设备影响而导致信令表现异常的基站,实现伪基站运动轨迹的准确跟踪。
-
公开(公告)号:CN111709472A
公开(公告)日:2020-09-25
申请号:CN202010543099.5
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种动态融合规则到诈骗行为识别模型的方法,包括:由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗行为的时空图;读取诈骗行为识别规则表中的每条规则,计算每个用户对应于每条规则的转换值;将每个用户对应于规则的转换值构成每个用户的通话特征指标向量,每个用户的通话特征指标向量即是时空图中每个用户的节点特征;构建、并训练诈骗行为识别模型,然后将待识别用户的节点特征输入至诈骗行为识别模型,并根据模型输出判断待识别用户是否是可疑诈骗行为号码。本发明属于信息技术领域,能实现规则和模型的动态融合,从而实时检测、并准确识别各种诈骗行为。
-
公开(公告)号:CN111708887A
公开(公告)日:2020-09-25
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111669757A
公开(公告)日:2020-09-15
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN110188805A
公开(公告)日:2019-08-30
申请号:CN201910414965.8
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06K9/62
Abstract: 一种诈骗群体的识别方法,包括有:步骤一、提取每对疑似诈骗号码和受害人号码之间的通话和短信话单,分别构建通话特征向量和短信特征向量,将所有疑似诈骗号码和受害人号码的通话特征向量和短信特征向量输入诈骗行为特征提取模型,从而获得每对疑似诈骗号码和受害人号码的诈骗特征指纹;其中,诈骗特征指纹用于标识每对疑似诈骗号码和受害人号码之间的诈骗行为程度;步骤二、根据每对疑似诈骗号码和受害人号码的诈骗特征指纹,识别每两个疑似诈骗号码之间的区别度,并将相互之间区别度低的疑似诈骗号码构成一个诈骗群体。本发明属于信息技术领域,能基于通话和短信话单,全面且准确的识别由诈骗行为接近的诈骗号码所构成的诈骗群体。
-
公开(公告)号:CN109587350A
公开(公告)日:2019-04-05
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/22 , H04W12/12 , H04W16/22 , G06F16/2458
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K-Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K-Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
-
-
-
-
-
-
-
-