-
公开(公告)号:CN109145582B
公开(公告)日:2021-07-23
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN108881369A
公开(公告)日:2018-11-23
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
公开(公告)号:CN103473287A
公开(公告)日:2013-12-25
申请号:CN201310385972.2
申请日:2013-08-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种自动分发、运行和更新可执行程序的方法及系统,包括客户端将可执行程序及相关文件所在目录打包成一个文件,并采用大文件分割及索引存储方法将打包文件存储到状态存储集群;工作节点定期到状态存储集群检测索引状态,当检测到有新的索引或已有索引有更新,按照索引方式将可执行程序下载到本地目录;工作节点定期到状态存储集群获取程序相关信息;工作节点根据程序相关信息,每隔心跳时间到本地目录检测可执行程序的下载状态,直到检测到可执行程序下载完成时,执行可执行程序;本发明可实现可执行程序的自动分发、运行及更新,尤其在线更新正在执行的可执行程序,无需重新提交Job信息,增加了系统的灵活性与稳定性。
-
公开(公告)号:CN105468669B
公开(公告)日:2019-05-21
申请号:CN201510671795.3
申请日:2015-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06K9/62
Abstract: 本发明涉及一种融合用户关系的自适应微博话题追踪方法,其步骤包括:1)通过用户集合中的所有用户的行为推动推文集合按时间线延展,并将用户集合中所有用户发表的推文映射到特征向量空间中;2)对推文特征空间进行坐标变换,使话题相关推文集合和话题非相关推文集合的分布为线性可分;3)在当前跟踪时间窗内,采用聚类算法对推文特征向量进行聚类,找到目标话题的相关推文集合;4)利用本轮得到的相关推文集合进行下一轮话题跟踪,并将与本轮得到的相关推文集合关联的用户添加至用户集合。本发明借助用户的历史行为增加了推文判断的稳定性,能够有效避免话题追踪过程中出现话题漂移的现象,并能够密切跟踪话题的焦点演变。
-
公开(公告)号:CN108491414A
公开(公告)日:2018-09-04
申请号:CN201810111700.6
申请日:2018-02-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种融合话题特征的新闻内容在线抽取方法,步骤包括:将新闻页面的html转化为DOM树,将所有文本节点按照先序遍历的顺序排列;对每一个文本节点的文本进行分词,去除停用词,获取关键词;基于所述关键词,生成局部最大相容类,获得整个页面产生的全部话题,计算每个话题权重特征;将包含所述权重特征的话题特征以及非内容特征量化成证据的形式,使用DS证据理论进行特征融合,获得文本节点是正文的概率;将所述概率进行平滑处理,使用Otsu算法计算使得类间方差最大的分割阈值,获得高特征值的文本节点并将其作为新闻正文。本发明还提供一种融合话题特征的新闻内容在线抽取系统。
-
公开(公告)号:CN105468669A
公开(公告)日:2016-04-06
申请号:CN201510671795.3
申请日:2015-10-13
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F16/951 , G06K9/6269
Abstract: 本发明涉及一种融合用户关系的自适应微博话题追踪方法,其步骤包括:1)通过用户集合中的所有用户的行为推动推文集合按时间线延展,并将用户集合中所有用户发表的推文映射到特征向量空间中;2)对推文特征空间进行坐标变换,使话题相关推文集合和话题非相关推文集合的分布为线性可分;3)在当前跟踪时间窗内,采用聚类算法对推文特征向量进行聚类,找到目标话题的相关推文集合;4)利用本轮得到的相关推文集合进行下一轮话题跟踪,并将与本轮得到的相关推文集合关联的用户添加至用户集合。本发明借助用户的历史行为增加了推文判断的稳定性,能够有效避免话题追踪过程中出现话题漂移的现象,并能够密切跟踪话题的焦点演变。
-
公开(公告)号:CN109145582A
公开(公告)日:2019-01-04
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN109062899A
公开(公告)日:2018-12-21
申请号:CN201810857156.X
申请日:2018-07-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/277
Abstract: 本发明公开了一种基于词性标注的文档相似性度量方法。本方法为:1)对于两待分析的文档doc1、doc2,使用词性标注工具对文档doc1、doc2进行词性标注,得到文档的词性标签,对词性标签进行编码,得到词性标签向量;2)根据文档doc1、doc2的词性标签分布和单词分布度量两文档doc1、doc2之间的距离;3)根据两文档doc1、doc2之间的距离确定两文档doc1、doc2之间的相似度。本发明使得文本之间的距离度量更加精确,可以被应用在信息检索、文本分类等自然语言处理任务中,能够大大提高文本分类任务的准确率。
-
公开(公告)号:CN107885705A
公开(公告)日:2018-04-06
申请号:CN201710930206.8
申请日:2017-10-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi-GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。
-
公开(公告)号:CN108881369B
公开(公告)日:2020-09-29
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
-
-
-
-
-
-
-
-