-
公开(公告)号:CN110134947B
公开(公告)日:2021-03-26
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN110134947A
公开(公告)日:2019-08-16
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN117234572A
公开(公告)日:2023-12-15
申请号:CN202310892421.9
申请日:2023-07-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F8/70 , G06F8/71 , G06F8/74 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及多模态数据提取技术领域,尤其为一种基于游戏引擎的多模态数据提取方法,包括如下步骤包括如下步骤:S1:通过对游戏文件逆向,获得游戏的资源文件;S2:通过对资源文件引擎特征提取,获得游戏资源文件中的游戏引擎;S3:通过对游戏资源文件中的游戏引擎进行特征融合获得融合特征进行多模态数据提取。本发明通过逆向手段分析游戏引擎,从游戏引擎对资源文件打包开始,深入研究打包流程和打包过程中使用的技术,无需运行游戏,直接从游戏安装路径下对资源文件提取,减少了资源浪费问题。
-
公开(公告)号:CN107135281B
公开(公告)日:2020-03-31
申请号:CN201710146433.1
申请日:2017-03-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京信息科技大学
Abstract: 本发明实施例提供一种基于多数据源融合的IP地域类特征提取方法,包括:步骤1、基于现有的IP地址定位数据库,计算每一定位数据库的权威度;步骤2、基于现有的IP地址定位数据库,计算每一定位数据库中定位数据的完整度;步骤3、根据步骤1和步骤2中的每一定位数据库的权威度和每一定位数据库中定位数据的完整度,确定定位数据的可信度;步骤4、根据定位数据的可信度,选取定位数据构建IP地域类特征知识库。
-
公开(公告)号:CN106970962A
公开(公告)日:2017-07-21
申请号:CN201710170469.3
申请日:2017-03-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/95 , G06F16/951
Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。
-
公开(公告)号:CN118051623A
公开(公告)日:2024-05-17
申请号:CN202410028993.7
申请日:2024-01-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/35 , G06N5/025 , G06N5/04 , G06F40/295 , G06F40/30 , G06F40/289 , G06F16/951 , G06F16/9535 , G06F16/9538 , H04L67/55
Abstract: 本发明涉及人工智能和知识工程技术领域,本发明提供了一种移动应用知识库构建系统和方法,能够实现面向移动应用知识库的构建,完成移动应用知识库的智能应用。本发明移动应用知识库构建系统,基于APP(应用)基础信息和内容数据的多源异构数据,通过应用实体抽取、属性抽取、关系抽取等结构化处理,结合移动APP推理规则和移动APP标签图谱实现,为移动APP相似性、关联性分析以及移动应用内容分析、风险研判等建立基于检索式的知识服务方式,提供了一种面向移动应用的知识库,是一套面向业务应用的知识属性体系,提高相关的工作和生产效率。
-
公开(公告)号:CN117278253A
公开(公告)日:2023-12-22
申请号:CN202311043720.1
申请日:2023-08-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L9/40 , H04L61/4511 , G06F21/56 , G06N3/04
Abstract: 一种基于DNS流量特征与进程特征的恶意软件检测装置与方法,该装置主要包括:DNS进程特征采集模块,部署于要保护的终端主机上,用于确定发起DNS请求的进程,获取其特征信息;DNS流量特征采集模块,部署于网关,用于获取终端主机发起的DNS请求,获取其流量特征信息;数据整合模块,用于对上述模块收集到的特征信息进行关联后发送给分析模块;分析模块,将收到的DNS特征数据输入预先训练好的神经网络,判断对应的进程是否有害。监控DNS请求中的流量特征和进程特征,有效地发现设备中存在的恶意软件。
-
公开(公告)号:CN116935117A
公开(公告)日:2023-10-24
申请号:CN202310887423.9
申请日:2023-07-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V10/764 , G06V10/56
Abstract: 本发明涉及标志物检测系统领域,尤其为一种复杂场景下特定标志物检测系统,包括:收集模块:用于通过网络爬虫技术对特定标志物图片进行收集,获得特定标志物图片;处理模块:用于对收集模块收集的特定标志物图片进行图片预处理,获得预处理数据;分类器训练模块:用于根据处理模块处理得到的预处理数据进行模型训练,得到自动分类模型;分类模块:用于连接自动分类模型,对特定标志物图片进行分类。本发明通过颜色和形状的标志物检测算法,从色彩增强、颜色分割和形状分类三个方面提高特定标志物检测系统算法的鲁棒性,通过比较RGB和HSV颜色分割效果,选取效果更好的HSV颜色分割,在形状分类中不仅仅使用简单的SVM模型训练而且同时使用Contourlet变化提高算法的鲁棒性使的算法预测效果更好,保证出现差错在系统允许的范围内。
-
公开(公告)号:CN106970962B
公开(公告)日:2020-08-11
申请号:CN201710170469.3
申请日:2017-03-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/95 , G06F16/953
Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。
-
-
-
-
-
-
-
-
-