-
公开(公告)号:CN108519983A
公开(公告)日:2018-09-11
申请号:CN201810113977.2
申请日:2018-02-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。
-
公开(公告)号:CN106803035A
公开(公告)日:2017-06-06
申请号:CN201611079933.X
申请日:2016-11-30
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/45 , G06F21/31 , G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明公开了一种基于用户名信息的密码猜测集生成方法及密码破解方法。本发明的密码破解方法为:1)对泄漏数据训练集中的用户名、密码分别进行分词和语义结构标注,计算用户名、密码的语义相似性;其中,所述语义相似性包括语义结构相似性和语义片段相似性;2)将该语义相似性应用到PCFGs语法中,即基于语义相似性构建PCFGs语法;3)根据步骤2)构建的PCFGs语法,按照概率降序生成密码猜测集;4)根据该密码猜测集进行密码破解。本发明利用用户名和密码的片段相似性和结构相似性,理解密码的构成语义,从而生成密码猜测集,提高密码破解效率。
-
公开(公告)号:CN107885705A
公开(公告)日:2018-04-06
申请号:CN201710930206.8
申请日:2017-10-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi-GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。
-
公开(公告)号:CN106570391A
公开(公告)日:2017-04-19
申请号:CN201610990079.6
申请日:2016-11-10
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/45 , G06F21/31 , G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明公开了一种基于记忆组块的密码猜测集生成方法及数字密码破解方法。本方法为:1)对训练集中的数字密码按记忆组块进行分割,提取数字密码的组成结构和组成片段;2)根据每种记忆组块在该训练集中的频数,计算得到每种记忆组块在训练集中的概率,以及每个数字密码的组合方式的概率;3)将每个数字密码最大概率的组合方式作为该数字密码的分割方式,然后根据记忆组块的频数更新该记忆组块的概率并计算组成结构的概率;4)将记忆组块应用到PCFGs语法中:将组成结构作为非终端结构,将记忆组块作为终端词;5)根据步骤4)得到的基于记忆组块的PCFGs语法,按照概率降序生成密码猜测集;6)根据该密码猜测集进行密码破解。
-
公开(公告)号:CN104794170B
公开(公告)日:2018-05-01
申请号:CN201510147426.4
申请日:2015-03-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。
-
公开(公告)号:CN104794170A
公开(公告)日:2015-07-22
申请号:CN201510147426.4
申请日:2015-03-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。
-
公开(公告)号:CN107885705B
公开(公告)日:2020-12-15
申请号:CN201710930206.8
申请日:2017-10-09
Applicant: 中国科学院信息工程研究所
IPC: G06F40/126 , G06F16/93
Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi‑GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。
-
-
-
-
-
-