-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
Abstract: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
公开(公告)号:CN106209833A
公开(公告)日:2016-12-07
申请号:CN201610538299.5
申请日:2016-07-08
Applicant: 汉柏科技有限公司 , 国家计算机网络与信息安全管理中心
CPC classification number: H04L63/1466 , H04L67/02
Abstract: 本发明公开一种防止网页劫持的方法及网关,涉及网络技术领域,所述方法包括:获取用户终端发送的超文本传输协议HTTP报文;判断所述HTTP报文是否为获取GET请求报文;若是,则对所述GET请求报文进行分段,得到至少两个分段报文;将各分段报文发送到运营商设备,以防止所述GET请求报文请求的网页在所述运营商设备被劫持。相比于现有技术,本发明提出的防止网页劫持的方法及网关,通过将用户终端发送的HTTP的GET请求报文进行分段,使劫持服务器无法识别GET请求报文,从而防止网页被劫持,提高了用户浏览网页的安全性。
-
公开(公告)号:CN105160251A
公开(公告)日:2015-12-16
申请号:CN201510390821.5
申请日:2015-07-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56
CPC classification number: G06F21/563 , G06F2221/033
Abstract: 本发明公开了一种APK应用软件行为的分析方法及装置,其中,该方法包括:接收用户上传的APK文件及体验数据,其中,体验数据为用户在APK文件对应的应用软件下的基础用户信息;使用体验数据在沙盒中动态运行对APK文件,并记录运行过程中APK文件的动态行为,以构建动态行为集;对APK文件进行静态分析,以构建静态行为集;根据动态行为集和静态行为集对APK文件进行综合分析,以确认APK文件的安全性能。通过运用本发明,解决了现有技术中的软件安全管理,都是在软件运行过程中进行监测,一旦发现问题对其进行记录及阻止,由于现有应用软件的复杂多样,目前的监测方式无法完全阻止非法应用软件窃取用户隐私及乱扣费等操作,用户体验较低的问题。
-
公开(公告)号:CN119598054A
公开(公告)日:2025-03-11
申请号:CN202510143768.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06V30/19
Abstract: 本发明涉及人工智能技术领域,提供一种网站类型识别方法、装置、电子设备和存储介质,其中方法包括:获取待识别网站的网址,并基于所述待识别网站的网址,获取所述待识别网站内所有的待分类图像;基于特征提取模型,对各待分类图像进行特征提取,得到所述各待分类图像的图像特征;基于文本特征库中的各文本特征和所述各待分类图像的图像特征,确定所述各待分类图像的类别;基于所述各待分类图像的类别,确定所述待识别网站的类型。本发明通过结合图像特征和文本特征,实现了基于图像和文本描述的多模态特征的检索式分类判断,可以有效提高网站类型识别的准确率。
-
公开(公告)号:CN114625978B
公开(公告)日:2024-11-08
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0985 , G06F16/9536 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN118520929B
公开(公告)日:2024-10-29
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN115080871B
公开(公告)日:2024-05-17
申请号:CN202210847062.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/901 , G06N3/0464 , G06N3/042 , G06N3/045 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种跨社交网络社交用户对齐方法,涉及社交网络的用户关系挖掘领域。本发明为了解决现有社交用户对齐方法不能跨社交网络、计算精度低、对齐效率低的缺陷,采用如下步骤实现:采集社交网络的用户属性信息,构建用户关系拓扑图;根据边权重和节点的出入度计算节点权重;构建一阶近邻关系模型和二阶近邻关系模型,确定一阶邻居节点和二阶邻居节点,得到用户节点之间的相互关系;构建社交对齐神经网络,通过社交对齐神经网络对用户关系拓扑图中各节点进行邻居节点的信息聚合、拼接与非线性变换,得到跨社交网络的社交用户身份对齐结果。本发明主要用于通过跨社交网络对其社交用户实现用户关系挖掘。
-
公开(公告)号:CN117251524A
公开(公告)日:2023-12-19
申请号:CN202310446513.4
申请日:2023-04-24
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/2431 , G06F18/2415 , G06F18/214 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种基于多策略融合的短文本分类方法,属于自然语言处理领域,主要涉及深度神经网络、数据增强以及文本分类。该方法包括如下步骤:通过数据预处理剔除噪声数据、基于词性标注关键词进行分类,基于数据增强的文本分类,最终通过多策略融合设置相应的阈值门限获取网络短文本数据标签。本发明通过提出一种基于多策略融合的短文本分类的解决方法,从而提升短文本数据分类的效果,进而提升业务人员发现相关短文本数据精准度和业务效率。
-
公开(公告)号:CN116684127A
公开(公告)日:2023-09-01
申请号:CN202310579956.0
申请日:2023-05-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种面向网络安全可解释网络数据标记方法、系统、计算设备,所述方法包括:模拟器对每一种网络攻击进行模拟,通过抓包操作获得对应的网络数据包,并在此基础上对数据进行聚类操作获得最终数据集;异常检测器对所述最终数据集的网络流量特征信息和解释器提供的部分解释结果进行统一建模,在每次与网络分析人员的交互中,确定一个可疑流量;解释器基于最大线性分离对当前所检测出可疑流量进行解释,并且向网络分析人员查询判断其是否为异常流量。本发明的优点是:充分利用解释器的计算资源,并使异常检测器可以与网络分析人员进行交互,其中通过解释器确保交互质量,最终使异常检测器模型具有适应动态网络环境的能力。
-
-
-
-
-
-
-
-
-