-
公开(公告)号:CN109376244A
公开(公告)日:2019-02-22
申请号:CN201811252792.6
申请日:2018-10-25
Applicant: 山东省通信管理局 , 国家计算机网络与信息安全管理中心山东分中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/35 , G06F16/958 , G06N3/08
CPC classification number: G06N3/084
Abstract: 本发明涉及网络安全技术领域,尤其涉及一种基于特征分类的诈骗网站识别方法。该方法包括以下步骤:将采集到的多个网站分别标识为安全网站和诈骗网站;将安全网站和诈骗网站中的文档分别标识为安全文档和诈骗文档;计算出各文档中每个词组分别出现在安全网站和诈骗网站中的卡方统计量,并根据词组的卡方统计量筛选得到敏感词组;计算出各文档中出现的每个敏感词组的正反向词频,作为各文档的特征向量;根据所有文档的特征向量训练出用于识别网站是否为诈骗网站的BP神经网络模型。本发明以安全网站和诈骗网站中文档的特征向量作为样本,得到用于识别网站是否为诈骗网站的BP神经网络模型,方法简单、操作方便,具有网站识别准确率高的优点。
-
公开(公告)号:CN109492219A
公开(公告)日:2019-03-19
申请号:CN201811250384.7
申请日:2018-10-25
Applicant: 山东省通信管理局 , 国家计算机网络与信息安全管理中心山东分中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F17/27 , G06F16/958 , G06N3/04
CPC classification number: G06F17/2785 , G06F17/2715 , G06F17/2775 , G06N3/0445
Abstract: 本发明涉及网络安全技术领域,尤其涉及一种基于特征分类和情感语义分析的诈骗网站识别方法。该方法包括以下步骤:为采集的网站文本中的每一个词添加情感标识,情感标识为积极和消极中的任一;将词的序列转换为词的向量,作为特征向量;使用长短期记忆网络对所有的特征向量进行训练,得到用于识别网站是否为诈骗网站的情感分析分类模型。本发明利用BP神经网络模型先对采集到的网站进行识别,只有在采集到的网站是诈骗网站的情况下,才对采集到的网站进行基于情感分析的判断,有利于降低误判率,提高网站识别准确率,还有利于提高用户体验,节约时间。
-
公开(公告)号:CN109284416A
公开(公告)日:2019-01-29
申请号:CN201811302840.8
申请日:2018-11-02
Applicant: 山东省通信管理局 , 国家计算机网络与信息安全管理中心山东分中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/63
Abstract: 本发明涉及音频检索技术领域,尤其涉及一种基于内容的海量音频快速检索方法。该方法包括以下步骤:为音频添加检索标识,并将检索标识与音频一一对应存储;为带有检索标识的音频添加分类索引,并将分类索引与带有检索标识的音频对应存储。接收用户的检索请求,并确定检索请求中的检索标识和分类索引;查找与检索标识和分类索引均匹配的音频;将查找到的音频显示出来。本发明根据用户检索请求中的检索标识和分类索引来查找音频,不仅能够准确的查找到用户需要的音频,提升用户体验,另外,也能够提高音频查找效率,具有方法简单和音频查找快速、准确的优点。
-
公开(公告)号:CN112185424A
公开(公告)日:2021-01-05
申请号:CN202011046908.8
申请日:2020-09-29
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提出一种语音文件裁剪还原方法、装置、设备和存储介质,设置最大静默时间和设置最小静默值;获取原始语音文件;获取原始语音文件中音频能量值低于最小静默值的无效语音片段;判断无效语音片段时长是否大于最大静默时间;对时长大于最大静默时间的无效语音片段的起点和终点进行裁剪;剔除裁剪得到无效语音片段,获得多段有效语音片段;顺序拼接多段有效语音片段,获得还原语音文件;识别语音文件中的静音部分,在语音裁剪时,可以从静音部分裁剪,保证语音片段的完整性,避免出现断词的现象,提高语音分析结果的正确率。
-
公开(公告)号:CN110248322A
公开(公告)日:2019-09-17
申请号:CN201910572375.8
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种基于诈骗短信的诈骗团伙识别方法及识别系统,该识别方法包括:实时识别并提取诈骗短信的敏感信息;对该诈骗短信进行通联关系分析,获取预定时间范围内所有相关通讯数据;从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息;根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。本发明提取诈骗短信的敏感信息,并获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
-
公开(公告)号:CN112185424B
公开(公告)日:2024-08-27
申请号:CN202011046908.8
申请日:2020-09-29
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提出一种语音文件裁剪还原方法、装置、设备和存储介质,设置最大静默时间和设置最小静默值;获取原始语音文件;获取原始语音文件中音频能量值低于最小静默值的无效语音片段;判断无效语音片段时长是否大于最大静默时间;对时长大于最大静默时间的无效语音片段的起点和终点进行裁剪;剔除裁剪得到无效语音片段,获得多段有效语音片段;顺序拼接多段有效语音片段,获得还原语音文件;识别语音文件中的静音部分,在语音裁剪时,可以从静音部分裁剪,保证语音片段的完整性,避免出现断词的现象,提高语音分析结果的正确率。
-
公开(公告)号:CN109359126B
公开(公告)日:2021-06-04
申请号:CN201811009136.3
申请日:2018-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/242 , G06F16/2453
Abstract: 本发明属于数据查询技术领域,具体而言,涉及一种基于业务用户习惯的智能学习查询模型的构建方法,包括如下步骤:S1、从数据源中获取业务用户的数据查询记录;S2、根据步骤S1中得到的所述数据查询记录,进行数据查询习惯分析;S3、根据步骤S2中得到的数据查询习惯分析结果构建查询模型。本发明还提供了一种基于业务用户习惯的智能学习查询系统。本发明通过对业务用户的数据查询习惯进行分析,针对分析结果制定数据查询方案,构建查询模型,能够提前将业务用户关注的数据推送给业务用户,具有查询时间短、用户体验效果好的特点。
-
公开(公告)号:CN111950022A
公开(公告)日:2020-11-17
申请号:CN202010797136.5
申请日:2020-08-10
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F21/62
Abstract: 本发明公开一种基于结构化数据的脱敏方法、装置与系统,所述方法包括:接收结构化数据,对所述结构化数据进行拆分,生成拆分数据;对拆分数据进行匿名化处理或去标识化处理,生成匿名化拆分数据或去标识化处理数据;组合匿名化拆分数据或去标识化处理数据,生成匿名化数据或去标识化数据。本发明可对大规模的结构化数据进行脱敏处理,为进一步拓展数据应用,增强数据分析效果提供数据保护方面的有效支持。对于结构化数据脱敏技术,本发明采用匿名化、去标识化方式对结构化数据进行脱敏,可对结构化数据中敏感字段进行脱敏处理,脱敏的标准为不可对应识别个体信息。脱敏后的数据保证数据的独立性和可区分性。去标识化的数据能够数据恢复。
-
公开(公告)号:CN111666765A
公开(公告)日:2020-09-15
申请号:CN202010490594.4
申请日:2020-06-02
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F40/289 , G06F16/35
Abstract: 本发明属于日志文本的诈骗话题聚类领域,特别涉及一种基于k-means文本聚类的诈骗话题分析方法和系统。该方法包括:收集日志文本,使用诈骗去留字典对所述文本进行预处理,生成多个特征模型;使用k-means对所述多个特征模型进行学习,建立诈骗文本预警模型;将对新的文本加入到所述日志文本中重新建立新文本预警模型;使用新文本预警模型与所述诈骗文本预警模型比较,对所述新的文本进行判断。本发明利用k-means技术对日志文本进行自动识别,有利于降低误判率,提高日志文本的识别准确率,节省时间。
-
公开(公告)号:CN110062114A
公开(公告)日:2019-07-26
申请号:CN201910281812.0
申请日:2019-04-09
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: H04M3/22
Abstract: 本发明涉及电信技术领域,尤其涉及一种基于ARIMA的诈骗电话预测方法及预测系统。该方法包括以下步骤:采集原始呼叫详细记录数据;将原始呼叫详细记录数据转换为时序数据;对时序数据进行标准化处理,得到训练样本;将训练样本输入构建的ARIMA模型,得到用于预测电话是否有害的电话预测模型。本发明根据原始呼叫详细记录数据对构建的ARIMA模型进行训练,得到预测有害电话的电话预测模型,该电话预测模型能够自动分析预测出主叫电话是否为有害电话,以及预测电信网的未来诈骗趋势,具有成本低、识别准确率高的优点。
-
-
-
-
-
-
-
-
-