-
公开(公告)号:CN113536077A
公开(公告)日:2021-10-22
申请号:CN202110606596.X
申请日:2021-05-31
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/953 , G06F16/901 , G06N20/00
Abstract: 本发明公开了一种移动APP特定事件内容检测方法,涉及网络信息安全和自然语言处理交叉技术领域。首先获取互联网上特定事件的若干内容作为原始语料,从中抽取原始关键词;针对原始语料构建关键词关系图,并对关键词关系图进行聚类,得到若干簇;对同一簇中的关键词进行量化和排序,得到最能够表达该事件的特征关键词;将特征关键词输入到APP搜索框中进行自动化检索,保存结果;使用机器学习算法对保存结果进行分析,实现了移动APP中特定事件的自动、高效检测分析。本发明以很低的搜索成本获得了不同移动应用针对特定事件的舆论观点和舆论走向信息。本发明还公开了一种移动APP特定事件内容检测装置。
-
公开(公告)号:CN112073584B
公开(公告)日:2021-05-18
申请号:CN202010941675.1
申请日:2019-08-27
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F21/57 , H04M1/72406 , H04M1/72454
Abstract: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN112073584A
公开(公告)日:2020-12-11
申请号:CN202010941675.1
申请日:2019-08-27
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
Abstract: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN119759719A
公开(公告)日:2025-04-04
申请号:CN202411830029.2
申请日:2024-12-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/34 , G06N3/0475 , G06N3/0455 , G06N3/08 , G06N5/022 , G06N5/04
Abstract: 一种基于提示学习的大模型测评数据生成方法及系统,属于机器学习模型领域,包括以下步骤:从提示模板集合中获取初始提示模板;对初始提示模板进行变异操作;接收输入;将变异后的提示模板和接收的输入相结合组成若干完整提示,将这些完整提示输入到生成模型中得到测评数据;评估测评数据的生成质量,将能生成高质量测评数据的提示模板放入提示模板集合中,供下一次测评数据生成使用。与现有技术相比,本发明具有测评数据生成质量高、测评数据生成成本低、测评数据生成速度快、测评场景丰富、测评数据生成容易实现等优点。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN118277914B
公开(公告)日:2025-01-24
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
-
-
-
-
-
-
-
-