-
公开(公告)号:CN106803035A
公开(公告)日:2017-06-06
申请号:CN201611079933.X
申请日:2016-11-30
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/45 , G06F21/31 , G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明公开了一种基于用户名信息的密码猜测集生成方法及密码破解方法。本发明的密码破解方法为:1)对泄漏数据训练集中的用户名、密码分别进行分词和语义结构标注,计算用户名、密码的语义相似性;其中,所述语义相似性包括语义结构相似性和语义片段相似性;2)将该语义相似性应用到PCFGs语法中,即基于语义相似性构建PCFGs语法;3)根据步骤2)构建的PCFGs语法,按照概率降序生成密码猜测集;4)根据该密码猜测集进行密码破解。本发明利用用户名和密码的片段相似性和结构相似性,理解密码的构成语义,从而生成密码猜测集,提高密码破解效率。
-
公开(公告)号:CN106127222A
公开(公告)日:2016-11-16
申请号:CN201610420846.X
申请日:2016-06-13
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/6215 , G06K9/2054
Abstract: 本发明公开了一种基于视觉的字符串相似度计算方法及相似性判断方法。本发明的字符串相似度计算方法为:1)将两待比较字符串中的每一字符分别转化为一对应灰度图片;2)将步骤1)得到的图片的每一行灰度值进行拼接,得到对应图片的一维向量;3)对两待比较字符串中任意两不同字符,计算这两个字符对应的两一维向量的相似度,根据该相似度确定所选两字符的字符相似度;4)基于上述得到的字符相似度和字符位置计算两待比较字符串的视觉相似度。该方法考虑到了不同的字符在人的视觉方法所呈现的不同差异,所计算得到的字符串相似度更加符合人的主观感受。
-
公开(公告)号:CN105608070A
公开(公告)日:2016-05-25
申请号:CN201510965136.0
申请日:2015-12-21
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
CPC classification number: G06F17/2745 , G06F17/2775
Abstract: 本发明涉及一种面向新闻标题的人物关系抽取方法,其步骤包括:1)寻找出新闻标题中的关系指示词,用以区分不同类别的人物关系;2)根据人物与关系指示词在新闻标题中的位置特征,建立描述句子的句式模板;利用训练数据统计每个模板的正/负例个数,根据正负模板的比例判定新闻标题中人物间关系的正确性;3)从新闻标题与人物属性知识库中提取特征,通过特征分类的方法并结合步骤2)得到的句式模板的正/负例个数,判定给定的人物关系是否正确。本发明在保证准确率的同时,降低了特征维度,提高了判定效率,可用于挖掘新闻标题中的人物关系,进而发现社会中的焦点人物、热点事件等,便于及时掌握社会动态,监控舆情。
-
公开(公告)号:CN104022899A
公开(公告)日:2014-09-03
申请号:CN201410231273.7
申请日:2014-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L12/24
Abstract: 本发明涉及一种网络管理系统的三维评估方法,包括对当前的网络状况和管理系统的需求进行分析;根据前面的分析结果,构建可动态可配置的评估模型指标体系;采用评估模型对要评估的管理系统进行模拟评估;如果通过则部署该管理系统;如果未通过,重新对评估模型进行修正;在管理系统部署后,对要评估的管理系统进行实践评估,如果未通过,重新对评估模型进行修正;如果通过,得出评估结果,并给出该管理系统部署后对网络中各方实体的影响,提供改进部署方法的建议;本发明可以对现有网络管理系统进行全面的评估,找出其中存在的缺陷并提出科学有效的部署整改意见,还可以应付大量网络设备的评估量,另外该评估方法具有很强的灵活性和高度的扩展性。
-
公开(公告)号:CN103761459A
公开(公告)日:2014-04-30
申请号:CN201410035906.7
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/16 , G06F17/2217
Abstract: 本发明涉及一种文档多重数字水印嵌入、提取方法及装置,文档多重数字水印嵌入方法,包括以下步骤:获取用户输入的原始水印信息、密钥及待处理的文档;计算原始水印信息中的摘要信息,生成新水印信息;将原始水印信息和新水印信息共同作为一条数据库记录存入数据库;将文档中的字符划分为两层,根据文档第一层的字符总数、新水印信息位的长度,得到待嵌入文档第一层的新水印信息的组数,将多组新水印信息按照从前往后的顺序嵌入到文档第一层中的属性位中;按照从后往前的顺序将多组新水印信息嵌入到文档第二层中的属性位中。本发明基于Word格式文档的字符属性,使用密钥提高了安全性,重复嵌入加强了鲁棒性,多重嵌入提高了水印容量。
-
公开(公告)号:CN103532791A
公开(公告)日:2014-01-22
申请号:CN201310512125.8
申请日:2013-10-25
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种发现并收集I2P网络中节点的方法,包括以下步骤:步骤1:获取多个FloodFill节点作为种子节点;步骤2:启动至少一个I2P路由器;步骤3:构造节点查询消息并发送至种子节点,迭代查询在I2P网络的ID键空间中所有FloodFill节点,并收集到FloodFill节点集;步骤4:发送一个非FloodFill节点查询消息到FloodFill节点集中的一个FloodFill节点上,收集所述FloodFill节点周围的所有非FloodFill节点;步骤5:判断FloodFill节点集中是否存在未收到非FloodFill节点查询消息的节点,如果是,进行步骤4;否则,继续;步骤6:完成非FloodFill节点的收集。本发明可评估、改善匿名通信系统I2P的安全性。
-
公开(公告)号:CN103036743A
公开(公告)日:2013-04-10
申请号:CN201210555371.7
申请日:2012-12-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种窃密木马的TCP心跳行为的检测方法,包括:步骤1,抓取网络数据包,还原成TCP数据流;步骤2,检测是否有TCP保活心跳行为;步骤3,检测是否有TCP连接内心跳行为;步骤4,检测是否有TCP连接级心跳行为:步骤5,对检测出的窃密木马心跳行为进行误判检测。本发明基于网络数据包大小、方向和时间等特征,能计算出心跳的周期及其波动的范围,方法简单,检测结果准确全面,能运用在实时检测窃密木马的系统中,具有较好的检测效果。
-
公开(公告)号:CN115965795A
公开(公告)日:2023-04-14
申请号:CN202211626368.X
申请日:2022-12-16
Applicant: 中国科学院信息工程研究所
IPC: G06V10/44 , G06V10/762 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于网络表示学习的深暗网群体发现方法,包括深暗网异质信息网络构建和基于自编码器的多视图深度嵌入式聚类;所述深暗网异质信息网络构建包含构建属性异质信息网络多种类型的节点和构建属性异质信息网络的多种类型的关系;所述基于自编码器的多视图深度嵌入式聚类,包含基于元路径的用户多视图构建、基于自编码器的用户嵌入表示学习和基于KL散度的自监督聚类;最终联合学习所述基于自编码器的用户嵌入表示学习和所述基于KL散度的自监督聚类,联合优化重建损失与聚类损失。对于一目标深暗网,利用优化后的编码器、基于KL散度的自监督聚类模块,得到目标深暗网每一用户的软标签分布。本发明可获得较好的群体发现结果。
-
公开(公告)号:CN108595706B
公开(公告)日:2022-05-24
申请号:CN201810443084.4
申请日:2018-05-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置。该基于主题词类相似性的文档语义表示方法包括:1)使用词向量模型对语料进行训练,得到词向量;2)在语义空间内对词向量进行聚类;3)使用WMD算法计算待表示文档和聚类得到的每个类别之间的距离,将得到的距离作为待表示文档的语义表示。进而,通过计算文档的语义表示向量之间的相似性,实现文档的分类。本发明依据文本的语义信息和单词频率等信息,通过WMD模型计算文本单词和聚类集合之间的转移代价,将文本表示成一个低维稠密、包含语义信息的向量,能更好地表示文本信息,分类任务准确性高,可应用在信息检索、文本分类等自然语言处理任务中。
-
公开(公告)号:CN109086327B
公开(公告)日:2022-05-17
申请号:CN201810716386.4
申请日:2018-07-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/958 , G06V30/146 , G06T7/13 , G06T7/155
Abstract: 本发明涉及一种快速生成网页视觉结构图形的方法及装置。该方法包括:提取网页中的文本域的视觉结构图形;提取网页中的图像域的视觉结构图形;将文本域的视觉结构图形与图像域的视觉结构图形去重与合并,得到网页的视觉结构图形。该装置包括文本域视觉结构图形提取模块、图像域视觉结构图形提取模块、去重与合并模块。本发明抛弃了传统分析方法中网页DOM结构的累赘,仅由网页截图应用图形学方法处理图片,大大降低了算法耗时;本发明采用数学形态学变换,能够快速、准确地分别提取网页中文本域与图像域的视觉结构图形。
-
-
-
-
-
-
-
-
-