-
公开(公告)号:CN106295347B
公开(公告)日:2019-06-18
申请号:CN201510284253.0
申请日:2015-05-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/57
Abstract: 本发明公开了一种用于搭建漏洞验证环境的方法及装置。例如,所述方法可以包括:提供要素库,以便用户从所述要素库中选择出需要的要素,其中,所述要素库中包含用于漏洞验证的文件对应的要素,当用户完成要素的选择时,使用系统镜像文件定制技术将选择出的要素对应的文件打包,得到用于生成虚拟机的漏洞验证模板。根据本发明公开的方法及装置,测试人员可以快捷地从要素库中选择用于漏洞验证的文件对应的要素,无需手动安装相关工具,减少了对人力的耗费,提高了漏洞验证环境的搭建效率。
-
公开(公告)号:CN109033166A
公开(公告)日:2018-12-18
申请号:CN201810636331.2
申请日:2018-06-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种人物属性抽取训练数据集构建方法。首先,下载HTML页面中的文本数据内容,提取描述人物正文内容和属性信息的信息框数据,并进行编码存储和语句切分;然后,对切分后的语句,选取既包含人物名称、人物属性值内容的语句构建人物属性抽取语料数据集;最后,提取人物属性抽取语料数据集中的所有动词,基于信息熵的方法对所有动词进行排序,提取排名靠前的动词作为属性触发词,把人物属性抽取语料数据集中不包含属性触发词的语句删除掉,剩下的语句就组成了人物属性抽取训练数据集。本发明综合利用的网页数据采集、词性分析、词语信息熵计算等技术自动构建人物属性抽取训练数据集,对提高训练数据集构建的效率具有重要意义。
-
公开(公告)号:CN108984521A
公开(公告)日:2018-12-11
申请号:CN201810635449.3
申请日:2018-06-20
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种新闻事件中人物观点抽取方法,包括观点抽取、人物观点数据库、观点检索3个部分;观点抽取部分负责对原始的新闻文本进行清理,并提取其中的观点要素包括观点持有者、观点评价对象、观点情感强度等;人物观点数据库负责存储人物、观点以及情感,以便检索和查询;观点检索部分负责响应用户的检索请求,对检索结果进行去重和合并,并返回排序的检索结果;本发明方法能够有效识别新闻中的人物观点并构建可供检索的人物观点数据库,提供了一种准确高效的人物观点抽取方法。
-
公开(公告)号:CN108897749A
公开(公告)日:2018-11-27
申请号:CN201810355382.8
申请日:2018-04-19
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于语法树和文本块密度的网页信息抽取方法,包括:获取网页的标题文本信息;设定筛选阈值,计算该网页所有节点的文本块密度,以该文本块密度大于该筛选阈值的节点为采集节点,提取该采集节点的节点文本信息;若该采集节点的数量为1,则以该节点文本信息为目标信息进行抽取;若该采集节点的数量大于1,则将该标题文本信息和该节点文本信息分别转换为唯一表达句子语义的标题深层语法树和节点深层语法树;获得每个该节点深层语法树与该标题深层语法树的整体相似度,以该整体相似度中的最大值对应的节点文本信息为目标信息进行抽取。
-
公开(公告)号:CN108769140A
公开(公告)日:2018-11-06
申请号:CN201810436632.0
申请日:2018-05-09
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: H04L67/2842 , G06K9/2054 , G06T1/20 , H04L41/0803 , H04L67/26 , H04L67/30 , H04W4/12
Abstract: 本发明提供一种实时图像文字识别缓存加速系统,包括配置管理服务器、处理结果缓存服务器和若干个图像文字识别处理服务器,上述的三种服务器组成局域网。本发明的有益效果为:通过减少对重复文字图像的处理次数就能够极大的加快整个系统的图像文字识别匹配速度,系统中图像的文字识别匹配的结果保存在了处理结果缓存结构中,在对文字图像进行是否为垃圾彩信的判断时,不是直接采用图像文字识别匹配相关算法,而是先在处理结果缓存结构中查找该图像是否被处理过,在处理结果缓存结构中查找处理结果,要比对图像进行文字识别匹配速度快很多。
-
公开(公告)号:CN108769115A
公开(公告)日:2018-11-06
申请号:CN201810354384.5
申请日:2018-04-19
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/08
CPC classification number: H04L67/1008
Abstract: 本发明涉及一种分布式RSS数据采集系统,包括:分布于网络的至少一个采集节点模块,用于采集该网络上的RSS数据;注册中心,用于保存所有该采集节点模块的信息,并将该信息提供给该调度模块;调度模块,用于根据该信息将采集任务分配给该采集节点模块。分布式RSS数据采集方法包括:通过注册中心收集分布于网络的采集节点模块的信息;通过调度模块拉取采集任务;通过该调度模块拉取该信息;根据该信息将该采集任务分配给该采集节点模块;采集该网络上的RSS数据。
-
公开(公告)号:CN107220709A
公开(公告)日:2017-09-29
申请号:CN201710175349.2
申请日:2017-03-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N7/00
CPC classification number: G06N7/005
Abstract: 本发明公开了一种概率图模型的近似推理算法,首先利用分离算法选择有效的k‑叉环不等式约束;然后将这些k‑叉环不等式约束对应的环组合到一个平面子图上,并逐次添加到对偶子问题中;最后通过优化对偶问题来求解原推理问题,本发明研究概率图模型近似推理算法,提出了一个基于等价性定理的平面子图选择准则,利用该准则设计了一个对偶分解框架下的快速收敛推理算法,该算法首先利用分离算法选择有效的k‑叉环不等式约束,然后将这些k‑叉环不等式约束对应的环组合到一个平面子图上,并逐次添加到对偶子问题中,最后通过优化对偶问题来求解原推理问题。实验表明,该算法与其它主流近似推理算法相比,收敛速度更快。
-
公开(公告)号:CN106227768A
公开(公告)日:2016-12-14
申请号:CN201610559782.1
申请日:2016-07-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于互补语料的短文本观点挖掘方法,是基于属性的观点挖掘;具体为:首先,从某段微博语料中选取训练语料,进行分词处理,词性标注和筛选;根据观点词将训练语料进行属性词的标注;并使用词性标注做为特征训练最大熵模型;然后,针对某个事件的微博语料和新闻语料,构建跨语料的话题模型,并结合最大熵模型,分析该事件所属的话题并提取相应的属性词分布和观点词分布;最后,针对某个具体共享话题的所有观点词或者某个具体独享话题中的所有观点词,利用情感分类器进行极性分析。本发明适用于对舆情事件的属性分析及观点挖掘,具有高效性、鲁棒性和易用性的特点,在观点挖掘、舆情监控等领域具有重要的应用价值。
-
公开(公告)号:CN103942491A
公开(公告)日:2014-07-23
申请号:CN201310729190.6
申请日:2013-12-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56
CPC classification number: G06F21/552 , G06F21/56
Abstract: 本发明公开了一种互联网恶意代码处置方法,包括:步骤S101,匹配可疑样本,计算可疑样本文件的哈希值,与已分析样本进行对比,判断是否已经分析过,如果是,则直接返回该可疑样本的已有分析结果;如果否,则转步骤S102;步骤S102,对于未分析过的可疑样本,调用杀毒引擎进行病毒扫描,判断该可疑样本是否属于已知恶意代码,如果是,则获得该恶意代码的信息;如果否,则转步骤S103;步骤S103,当可疑样本属于未知恶意代码时,进行全面的动态分析,得到恶意代码分析报告。本发明能自动快速分析各种恶意代码,生成恶意代码分析报告,为研究恶意代码防御和清除方法提供依据。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
-
-
-
-
-
-
-
-