-
公开(公告)号:CN114143290B
公开(公告)日:2024-01-30
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN116506183A
公开(公告)日:2023-07-28
申请号:CN202310476554.8
申请日:2023-04-27
Applicant: 国家计算机网络与信息安全管理中心广东分中心
IPC: H04L9/40
Abstract: 本发明公开了一种网络数据泄露途径确定方法及装置,该方法为每一次的流量数据匹配对应的特征数据模型;确定出每一个特征数据模型的分值;将离数据泄露时间点最近的特征数据模型作为源点模型,并将所有与所述源点模型相同数据特征的特征数据模型进行两两连线;确定出所述源点模型与其连线的所有特征数据模型之间分值和最低的路径得到路径集;将所述路径集中经过特征数据模型最多的路径作为所述泄露途径,泄露途径确定过程全程自动完成,避免了对人力资源的依赖,且提升了在数据交互频繁的情况下对泄露途径进行确定的效率和准确性。
-
公开(公告)号:CN114143290A
公开(公告)日:2022-03-04
申请号:CN202111407941.3
申请日:2021-11-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
Inventor: 周小敏 , 应鸿晖 , 林国池 , 石易 , 麦丽娟 , 莫凡 , 林佳涛 , 黄福鸿 , 李高翔 , 卓采标 , 杨慧强 , 廖淑敏 , 宋宜昌 , 周毅 , 黄正国 , 吴冠标 , 李新 , 蒋维 , 曹勇 , 高欢
IPC: H04L61/5061 , H04L61/5007 , H04L61/5053 , H04L67/56 , G06F16/951
Abstract: 本发明属于IP代理技术领域,具体涉及一种多网站并行爬取的IP代理池的构建系统和方法,所述构建系统包括:IP验证模块,用于对初始IP集合内的代理IP进行代理可用性验证,并将可用的代理IP置入有效队列中,得到有效IP集合;IP标记模块,用于对有效IP集合内的代理IP进行逐一标记,得到具有标记信息的标记IP集合;IP组合模块,用于获取若干待爬取网站信息并为每个待爬取网站构建对应的网站代理IP队列,还用于基于待爬取网站信息在标记IP集合中挑取标记信息与其匹配的代理IP,并将挑取的代理IP置入与其匹配的网站代理IP队列中。上述构建系统构建了多网站并行爬取代理池,实现了多网站并行爬取,进而提高代理IP的利用率以及爬取成功率。
-
公开(公告)号:CN109934251B
公开(公告)日:2021-08-06
申请号:CN201811615581.4
申请日:2018-12-27
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 北京天融信网络安全技术有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种用于小语种文本识别的方法,包括以下步骤:S1.构建来源于不同语种的训练文本集;S2.对训练文本集中的文本进行基于字节的N‑gramrank特征的提取;S3.对训练文本集中的文本进行基于互信息的度量特征的提取,即计算文本中的所有信息字节在单个语种中的信息度量;S4.对训练文本集中的文本进行基于转移概率的概率特征的提取,即计算文本中所有相邻字节能在单个语种中表达完整信息的概率;S5.利用步骤S2~S4提取的特征训练分类器;S6.对待识别的文本按照步骤S2~S4进行特征的提取,然后将提取的特征输入分类器中进行识别,分类器输出语种识别结果。
-
公开(公告)号:CN113095858A
公开(公告)日:2021-07-09
申请号:CN202110497356.0
申请日:2021-05-07
Applicant: 广州市刑事科学技术研究所 , 国家计算机网络与信息安全管理中心广东分中心
IPC: G06Q30/00 , G06F16/335 , G06F16/35 , G06F40/194 , G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明为解决没有考虑对文本信息的过滤及涉诈类别的分类导致存在识别准确率和效率低的问题,提出一种涉诈短文本识别方法,包括以下步骤:获取待识别的短文本,对所述短文本中的正常短文本进行过滤,得到疑似涉诈短文本数据集;将所述疑似涉诈短文本数据集输入神经网络模型中提取语义特征;根据所述疑似涉诈短文本数据集中字符的拼音和笔顺与预设的涉诈关键词的相似度对所述疑似涉诈短文本数据集进行特征抽取得到人工特征,并基于预设的涉诈关键词进行硬匹配,得到硬匹配特征;将所述语义特征、人工特征和硬匹配特征进行特征融合后通过多分类算法进行建模训练,生成用于诈骗短文本识别的分类器,输出得到涉诈短文本识别结果。
-
公开(公告)号:CN105872127A
公开(公告)日:2016-08-17
申请号:CN201610346936.9
申请日:2016-05-24
Applicant: 国家计算机网络与信息安全管理中心广东分中心
IPC: H04L29/12
CPC classification number: H04L61/6009 , H04L61/2007 , H04L61/2503
Abstract: 本发明公开了一种IP地址管理系统,包括:IP存储终端、一级IP使用单位、二级IP使用单位以及多级IP使用单位;IP对比服务器用于将一级IP使用单位向IP存储终端存储的备份数据与IP存储终端所存储的存储数据做对比,同时将对比结果反馈到一级IP使用单元;各级IP使用单位将存储数据更正后重新逐级向上存储。下属各级单位在上报到总服务器前都要先归总到一级IP使用单位,再由一级IP使用单位通过人工核实后才确认存储到总服务器的IP存储终端。通过IP地址管理系统帮助一级IP使用单位发现具体存储失败原因,并通过自身核查将正确数据成功存储到终端机构的总服务器数据库,使总服务器数据趋于准确全面。
-
公开(公告)号:CN111639703B
公开(公告)日:2023-11-14
申请号:CN202010471807.9
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F18/23213 , H04W64/00 , H04W16/18
Abstract: 本发明涉及通信技术领域,更具体地,涉及一种基于离散点集最小包围圆计算基站位置的方法,包括以下步骤:S1,采集基站终端位置数据,建立数据采集点集合P;S2,对数据采集点集合P中异常的数据进行清洗;S3,计算数据采集点集合P的最小包围圆,将最小包围圆的圆心作为待处理基站的最终位置;S4,判断是否为非全向基站,若否,直接进入步骤S5,若是,对临近小区的基站进行K‑means聚类计算,获得临近小区非全向基站的最终基站位置;S5,对多次计算获得历史基站位置进行K‑means聚类调优,本发明通过综合K‑means聚类算法和最小包围圆算法两种算法的优点,在最大减少信息依赖的情况下,较准确计算获得基站的位置数据,最终构建出一份已有基站的较准确位置信息清单。
-
公开(公告)号:CN115563342A
公开(公告)日:2023-01-03
申请号:CN202211277485.X
申请日:2022-10-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 人民中科(北京)智能技术有限公司
IPC: G06F16/75 , G06F16/783 , G06F16/738
Abstract: 本发明公开了一种视频主题检索的方法、系统、设备及存储介质,用以解决现有技术样例视频的相似度计算是在较低级别上进行的问题。方法包括:S1、预训练跨模态视觉语言模型,并对所述跨模态视觉语言模型进行调整;S2、对给定的样例视频集合的场景进行分割,并对分割后的各样例视频片段的主题进行聚类;S3、基于所述调整后的跨模态视觉语言模型以及聚类的样例视频片段进行视频主题检索,并对检索结果进行聚合和排序后输出。系统包括:预训练和调整模块、分割和聚类模块、输出模块。计算机设备包括:存储器、处理器,以及计算机程序。包含计算机可执行指令的存储介质用于执行视频主题检索的方法。
-
-
-
-
-
-
-