-
公开(公告)号:CN106168946A
公开(公告)日:2016-11-30
申请号:CN201610474472.X
申请日:2016-06-24
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/2765 , G06F17/30867
Abstract: 本发明提供一种识别用户名缩写现象的方法,步骤包括:1)对两个或两个以上的用户名中的字符进行过滤,仅保留英文字母和数字;2)将上述过滤后的用户名各分割成若干个连续片段,各选取每个片段的首字符组成一新字符串;3)根据上述新字符串获取最长缩写词长度,如长度值大于或等于给定阈值ΔL,则判定所述用户名间具有用户名缩写现象;将保留的英文字母统一转换成小写或大写的形式;所述片段为单词或单个字符;所述片段根据指定的字典分割得到;采用动态规划算法根据所述新字符串获取最长缩写词长度。
-
公开(公告)号:CN103458046B
公开(公告)日:2016-09-07
申请号:CN201310418482.8
申请日:2013-09-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于核心网络的数据秘密共享系统及方法,包括信息发布端将待发送的目标信息隐藏在掩体信息中,将掩体信息发布到特定网络应用中,当有无辜用户下载特定网络应用中的资源时,下载的信息流经转发路由器,转发路由器识别下载的信息是否为掩体信息,如果是则复制掩体信息,将原信息发送给无辜用户,将复制的掩体信息通过后台服务器发送给真正的信息接收端;上述隐蔽握手过程只需要信息的发布端和路由器参与,不需要信息接收端参与,这种方式在提高隐蔽通信效率的同时,也增加了敌手检测的难度,并且将待发送的目标信息隐藏在掩体信息中,提高信息传输的隐蔽性。
-
公开(公告)号:CN103761459B
公开(公告)日:2016-08-17
申请号:CN201410035906.7
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种文档多重数字水印嵌入、提取方法及装置,文档多重数字水印嵌入方法,包括以下步骤:获取用户输入的原始水印信息、密钥及待处理的文档;计算原始水印信息中的摘要信息,生成新水印信息;将原始水印信息和新水印信息共同作为一条数据库记录存入数据库;将文档中的字符划分为两层,根据文档第一层的字符总数、新水印信息位的长度,得到待嵌入文档第一层的新水印信息的组数,将多组新水印信息按照从前往后的顺序嵌入到文档第一层中的属性位中;按照从后往前的顺序将多组新水印信息嵌入到文档第二层中的属性位中。本发明基于Word格式文档的字符属性,使用密钥提高了安全性,重复嵌入加强了鲁棒性,多重嵌入提高了水印容量。
-
公开(公告)号:CN103744994A
公开(公告)日:2014-04-23
申请号:CN201410030664.2
申请日:2014-01-22
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30702
Abstract: 本发明涉及一种面向通信网络的用户行为模式挖掘方法及系统,包括:获取一系列网络快照,根据活跃度确定研究对象,确定M个与研究对象相关的相关特征,并根据相关特征计算每个网络快照的特征矩阵,进而计算基准特征矩阵;对基准特征矩阵和每个网络快照的特征矩阵做标准化处理,分解标准化基准特征矩阵得到模元矩阵和系数矩阵;利用每个网络快照的标准化特征矩阵和模元矩阵计算每个网络快照中所有研究对象的行为模式矩阵,即本发明采用“相关特征-模元-行为模式”的三元对应关系表示用户行为模式,为用户的通信行为模式提供统一的表示方法,在用户量大的情况下用户间的模式对比清晰明了,有助于方便正确地检测数据集中用户行为模式的变化情况。
-
公开(公告)号:CN109145582B
公开(公告)日:2021-07-23
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN107341183B
公开(公告)日:2021-06-22
申请号:CN201710397901.2
申请日:2017-05-31
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/35
Abstract: 本发明公开了一种基于暗网网站综合特征的网站分类方法。本方法为:1)爬取目标暗网网站,得到一带标注的暗网网站训练集合;2)提取该集合中每一网站信息进行分词,构建该网站的词的空间向量,并计算每一词的权重;将词与对应权重进行相乘后的空间向量作为网站的文本特征;3)提取该暗网网站训练集合中每一网站的标签,构建该网站的标签的空间向量,并计算每个标签的权重;将标签与对应权重相乘后的空间向量作为网站的结构特征;4)将每一网站的文本特征与结构特征结合得到该网站的综合特征;5)对各网站的综合特征进行训练,得到一分类模型;然后利用该分类模型对待分类网站进行预测,得到该待分类网站的类别。本发明提高了网站分类效率。
-
公开(公告)号:CN106570179B
公开(公告)日:2019-11-19
申请号:CN201610991857.3
申请日:2016-11-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种面向评价性文本的核心实体识别方法及装置。该方法包括以下步骤:1)输入评价性文本,基于专家规则和行业专有词典识别该评价性文本中的核心实体;2)对步骤1)未识别出核心实体的评价性文本,使用训练好的基于词的双向LSTM模型进行核心实体识别;3)对步骤2)未识别出核心实体的评价性文本,通过对已有实体集的统计并结合文本分词和词性标注,生成候选实体作为核心实体。该装置包括规则匹配模块、模型识别模块和候选实体生成模块。本发明针对多类型混杂的评价性文本,能够准确有效地提取文本中的核心实体,为用户决策判断提供有力依据。
-
公开(公告)号:CN106127222B
公开(公告)日:2019-06-04
申请号:CN201610420846.X
申请日:2016-06-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于视觉的字符串相似度计算方法及相似性判断方法。本发明的字符串相似度计算方法为:1)将两待比较字符串中的每一字符分别转化为一对应灰度图片;2)将步骤1)得到的图片的每一行灰度值进行拼接,得到对应图片的一维向量;3)对两待比较字符串中任意两不同字符,计算这两个字符对应的两一维向量的相似度,根据该相似度确定所选两字符的字符相似度;4)基于上述得到的字符相似度和字符位置计算两待比较字符串的视觉相似度。该方法考虑到了不同的字符在人的视觉方法所呈现的不同差异,所计算得到的字符串相似度更加符合人的主观感受。
-
公开(公告)号:CN108959242A
公开(公告)日:2018-12-07
申请号:CN201810431801.1
申请日:2018-05-08
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/278 , G06K9/6256
Abstract: 本发明涉及一种基于中文字符词性特征的目标实体识别方法及装置。该方法包括:1)在训练文本中标记目标实体并进行分词及词性标注;2)将训练文本拆分为字符,得到字符序列,每个字符保留拆分之前的词性;3)将字符的词性与字符在分词中的位置进行拼接作为字符词性,得到字符词性序列;4)将对目标实体的标记映射至目标实体中的各个字符上,得到字符标注序列;5)将字符序列与字符词性序列作为特征,将字符标注序列作为训练目标值,输入机器学习模型中进行训练;6)将待识别文本的字符序列与字符词性序列输入训练好的机器学习模型,得到目标实体识别结果。本发明能够根据需求在中文文本中准确有效地对所需特定目标实体进行识别与提取。
-
公开(公告)号:CN108881369A
公开(公告)日:2018-11-23
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
-
-
-
-
-
-
-
-