-
公开(公告)号:CN107992473A
公开(公告)日:2018-05-04
申请号:CN201711190871.4
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。
-
公开(公告)号:CN106970962A
公开(公告)日:2017-07-21
申请号:CN201710170469.3
申请日:2017-03-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/95 , G06F16/951
Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。
-
公开(公告)号:CN105871630A
公开(公告)日:2016-08-17
申请号:CN201610370749.4
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种确定网络用户的上网行为类别的方法,该方法,包括:提取每个待测网络用户的上网行为特征,并通过文档向量空间模型的量化方法形成用户行为特征矩阵X;根据所述用户行为特征矩阵X,通过概率潜在语义分析方法PLSA和EM算法,得到行为倾向集合T以及“用户?倾向”概率分布矩阵D;根据所述用户行为特征矩阵X,通过支持向量机SVM算法,得到“特征词?类别”概率分布矩阵C;通过矩阵乘法运行T×C得到“倾向?类别”映射矩阵M;通过矩阵乘法运行D×M得到“用户?类别”概率分布矩阵Y;根据任一待测网络用户在各个类别上的概率分布情况,将所述任一待测网络用户分类到概率值最大的类别中。
-
公开(公告)号:CN104866567A
公开(公告)日:2015-08-26
申请号:CN201510266326.3
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/904
Abstract: 本发明提供一种业务数据呈现方法及装置,用于解决目前业务数据到单一图表的转化方式难以满足用户对业务逻辑、成果的多样化展示的问题。该方法包括:根据预先设置的业务场景模型中各单元格内的业务规则中定义的业务数据获取规则获取待呈现的业务数据的集合;按照所述业务规则中预先设定的与所述各单元格对应的图表类型以图表的形式呈现所述数据集合中对应于所述各单元格的业务数据,该方案使得业务数据得以根据用户的需求被多样化的展示,提升了用户体验。
-
公开(公告)号:CN102073547B
公开(公告)日:2013-08-28
申请号:CN201010611827.8
申请日:2010-12-17
Applicant: 国家计算机网络与信息安全管理中心 , 曙光信息产业(北京)有限公司
IPC: G06F9/50
Abstract: 本发明提供了一种多路服务器多缓冲区并行收包的性能优化方法。驱动软件负责分配接收报文使用的缓冲区,需要在内核中为每一个线程申请一个报文缓冲区,因为在内核中申请,所以申请内存时,可以通过参数指定内存的相连的CPU号为线程编号,也就是说,为线程0申请0号CPU上的本地内存,为线程1申请1号CPU上的本地内存。接口库软件在每个线程第一次调用接收报文的API接口时,把线程绑定到与线程号相对应的CPU上。有效避免了CPU访问远地内存和线程在多个CPU上调度的开销,提高了多线程收包的效率。
-
公开(公告)号:CN108810020B
公开(公告)日:2021-05-18
申请号:CN201810776782.6
申请日:2018-07-13
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06 , H04L12/12 , H04B7/185 , H04W12/088 , H04W52/38
Abstract: 本发明提供一种空间互联网管控方法,其步骤包括:实时监测卫星空间站与卫星接收终端之间的星地信号以及卫星接收终端与用户终端之间的WiFi信号,找出卫星互联网用户;对检测到的卫星互联网用户的WiFi信号进行解调、协议解析及内容还原,根据管控策略判断是否含有非法内容;如果含有非法内容,通过噪声干扰来阻断区域范围内的星地信号,通过协议阻断来阻断WiFi信号。
-
公开(公告)号:CN107491689B
公开(公告)日:2020-10-16
申请号:CN201710560788.5
申请日:2017-07-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种密码破解方法和装置,方法包括:CPU按照预设分析规则将待破解密码拆分为由掩码和子字符串组成的形式,并为掩码和子字符串分别生成对应的密码口令空间,将子字符串的密码口令空间划分给一个或多个GPU;一个或多个GPU均根据被划分到的子字符串生成一个密码口令子空间,均根据各自生成的密码口令子空间与掩码进行排列组合,生成完整密码口令空间,并使用完整密码口令空间对待破解密码进行破解。本发明的密码破解方法可以明显减少待破解密码产生的排列组合的数量,并由CPU和GPU协同计算,对密码排列组合产生的空间进行划分,提高了密码破解的效率,解决了现有技术的问题。
-
公开(公告)号:CN105912716B
公开(公告)日:2019-09-10
申请号:CN201610285420.8
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种短文本分类方法及装置。该方法包括:对待分类的短文本进行分词预处理,并获取分词得到的每个词语的扩展词;根据预先构建的词项集获取每个词语及其扩展词的权重值;根据权重值,利用多个类别SVM分类模型获取短文本所属每个类别的概率;根据预设的概率分类模型确定短文本的所属类别。本发明所提供的短分本分类方法,克服了短文本特征稀疏的问题,有效降低采用多分类模型的复杂度,更符合实际应用。
-
公开(公告)号:CN109359301A
公开(公告)日:2019-02-19
申请号:CN201811219240.5
申请日:2018-10-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/27 , G06F16/35 , G06F16/958
Abstract: 本发明公开了一种网页内容的多维度标注方法及装置,该方法包括:将待标注的网页内容文本转换为词向量;根据词向量,进行卷积神经网络分类,并将分类结果作为第一类维度标注结果;对待标注的网页内容进行第二类维度实体识别,得到第二类维度实体词;构建第二类维度规则知识库;将第二类维度实体词与第二类维度规则知识库进行匹配,得到第二类维度标注结果。本发明从网页的内容出发,利用有监督的深度学习分类方法卷积神经网络对第一类维度进行标注,解决了传统基于词频统计分类方法分类准确率低的问题;利用命名实体识别和规则知识库对第二类维度进行标注,丰富了网页的标注内容,提升了用户体验。
-
公开(公告)号:CN109241438A
公开(公告)日:2019-01-18
申请号:CN201811128658.5
申请日:2018-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F17/27
Abstract: 本发明公开了一种基于要素的跨通道热点事件发现方法、装置及存储介质,本发明融合某一领域的新闻报道数据与微博数据,通过联合两个通道提取的要素与文本语义相似度分析,有利于发现该领域热点事件,并且更全面细致的了解热点事件。
-
-
-
-
-
-
-
-
-