-
公开(公告)号:CN114090775A
公开(公告)日:2022-02-25
申请号:CN202111376161.7
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 李高翔 , 黄福鸿 , 卓采标 , 廖淑敏 , 杨慧强 , 宋宜昌 , 黄正国 , 周毅 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: G06F16/35 , G06F16/33 , G06F16/951 , G06F16/957
Abstract: 本发明属于网页文本处理领域,具体涉及一种基于BERT算法的网页有害文本识别方法及系统,所述识别方法包括:步骤1:使用网络爬虫爬取网页原始内容,得到初始文本;步骤2:基于HTML协议对初始文本进行文本整理,得到待识别文本集合;步骤3:将待识别文本集合输入到基于BERT中文预训练模型训练得到的有害信息识别模型中进行有害文本识别,得到识别结果;步骤4:对识别结果进行人工验证,并基于得到的异常识别样本更新有害信息识别模型。上述方法不仅准确提取有效的网页文本,利用已有的有害文本判断模型实现网页文本内容识别,同时还通过人工校正对有害文本判断模型进行训练更新,进一步提升有害文本判断模型的准确性。
-
公开(公告)号:CN111666308A
公开(公告)日:2020-09-15
申请号:CN202010493243.9
申请日:2020-06-03
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/2457
Abstract: 本发明提供一种基于行为分析的大数据智能推荐查询方法,所述方法包括如下步骤:S1:从用户日志系统中提取用户的数据查询记录;S2:根据步骤S1中取得的所述数据查询记录进行热点数据分析;S3:根据步骤S2中得到的热点数据分析结果构建查询模型。本发明提供了一种方法通过对用户行为分析技术,有效发现不同业务用户的数据热度,根据用户的行为习惯进行提前推荐数据,实现数据高速查询。
-
公开(公告)号:CN110267272A
公开(公告)日:2019-09-20
申请号:CN201910572213.4
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种诈骗短信识别方法及识别系统,该方法包括:收集多条历史诈骗短信的相关数据,并从每条历史诈骗短信的相关数据提取历史诈骗短信的特征向量和诈骗类别;根据历史诈骗短信的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;接收新短信的相关数据,并从每条新短信的相关数据中提取新短信的特征向量;将新短信的特征向量输入诈骗短信判断模型中,获取新短信是否属于诈骗短信以及属于哪种诈骗类别。本发明收集并根据多条历史诈骗短信的相关数据获取诈骗短信判断模型,该诈骗短信判断模型基于历史诈骗短信的相关数据,不限于短信内容,使得诈骗短信判断模型能够从多方面综合判断新短信是否属于诈骗短信以及哪种诈骗短信。
-
公开(公告)号:CN109905282A
公开(公告)日:2019-06-18
申请号:CN201910281123.X
申请日:2019-04-09
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及通讯信息安全技术领域,尤其涉及一种基于LSTM的诈骗电话预测方法及预测系统。该方法包括以下步骤:采集被叫地的原始电话数据;将原始电话数据转换为时序电话数据;对时序电话数据进行标准化处理,得到训练数据、测试数据和验证数据;根据训练数据对构建的LSTM模型进行训练,得到预测有害电话的电话预测模型。本发明根据被叫地的原始电话数据对构建的LSTM模型进行训练,得到预测有害电话的电话预测模型,该电话预测模型能够自动分析预测出主叫电话是否为有害电话,具有成本低、识别准确率高的优点。
-
公开(公告)号:CN114143290B
公开(公告)日:2024-01-30
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN114143290A
公开(公告)日:2022-03-04
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN109359126B
公开(公告)日:2021-06-04
申请号:CN201811009136.3
申请日:2018-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F16/242 , G06F16/2453
Abstract: 本发明属于数据查询技术领域,具体而言,涉及一种基于业务用户习惯的智能学习查询模型的构建方法,包括如下步骤:S1、从数据源中获取业务用户的数据查询记录;S2、根据步骤S1中得到的所述数据查询记录,进行数据查询习惯分析;S3、根据步骤S2中得到的数据查询习惯分析结果构建查询模型。本发明还提供了一种基于业务用户习惯的智能学习查询系统。本发明通过对业务用户的数据查询习惯进行分析,针对分析结果制定数据查询方案,构建查询模型,能够提前将业务用户关注的数据推送给业务用户,具有查询时间短、用户体验效果好的特点。
-
公开(公告)号:CN110062114A
公开(公告)日:2019-07-26
申请号:CN201910281812.0
申请日:2019-04-09
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: H04M3/22
Abstract: 本发明涉及电信技术领域,尤其涉及一种基于ARIMA的诈骗电话预测方法及预测系统。该方法包括以下步骤:采集原始呼叫详细记录数据;将原始呼叫详细记录数据转换为时序数据;对时序数据进行标准化处理,得到训练样本;将训练样本输入构建的ARIMA模型,得到用于预测电话是否有害的电话预测模型。本发明根据原始呼叫详细记录数据对构建的ARIMA模型进行训练,得到预测有害电话的电话预测模型,该电话预测模型能够自动分析预测出主叫电话是否为有害电话,以及预测电信网的未来诈骗趋势,具有成本低、识别准确率高的优点。
-
公开(公告)号:CN108536841A
公开(公告)日:2018-09-14
申请号:CN201810332569.6
申请日:2018-04-13
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F17/30
Abstract: 本发明属于数据查询技术领域,具体而言,涉及一种基于业务用户习惯的智能学习查询模型,其方法包括步骤一,对业务用户的数据查询习惯进行分析;步骤二,针对所述数据查询习惯的分析结果制定数据查询方案;步骤三,根据所述数据查询方案构建数据查询模型;步骤四,根据所述数据查询模型对现有数据查询系统进行改造。查询系统包括数据源存储系统、数据过滤系统、用户数据存储系统和数据展示系统。本发明通过对业务用户的数据查询习惯进行分析,针对分析结果制定数据查询方案,并对现有数据查询系统进行改进,能够提前将业务用户关注的数据推送给业务用户,具有查询时间短,用户体验效果好的特点。
-
公开(公告)号:CN110248322A
公开(公告)日:2019-09-17
申请号:CN201910572375.8
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种基于诈骗短信的诈骗团伙识别方法及识别系统,该识别方法包括:实时识别并提取诈骗短信的敏感信息;对该诈骗短信进行通联关系分析,获取预定时间范围内所有相关通讯数据;从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息;根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。本发明提取诈骗短信的敏感信息,并获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
-
-
-
-
-
-
-
-
-