一种基于潜层语义分析的安全的文档相似性计算方法和系统

    公开(公告)号:CN108519983A

    公开(公告)日:2018-09-11

    申请号:CN201810113977.2

    申请日:2018-02-05

    Abstract: 本发明涉及一种基于潜层语义分析的安全的文档相似性计算方法和系统。该方法在不泄露敏感词项的前提下,需进行文档相似性计算的双方借助私有的集合交集计算协议进行全局向量空间的约定;然后双方基于潜层语义分析模型和同态加密技术,进行基于向量的安全的文档相似性计算。本发明在约定全局向量空间时,可以保证不暴露一方的敏感词项给另一方;在使用同态加密技术在两方之间进行基于潜层语义分析的文档相似性计算时,不会泄露各自的文档向量。本发明在保证计算的安全性同时,能够提高文档相似计算的准确率与效率。

    一种高效可扩展的安全的文档相似性计算方法和装置

    公开(公告)号:CN107885705A

    公开(公告)日:2018-04-06

    申请号:CN201710930206.8

    申请日:2017-10-09

    Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi-GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。

    基于指纹多重哈希布隆过滤器的网络取证内容溯源方法和系统

    公开(公告)号:CN104794170B

    公开(公告)日:2018-05-01

    申请号:CN201510147426.4

    申请日:2015-03-30

    Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。

    基于指纹多重哈希布隆过滤器的网络取证内容溯源方法

    公开(公告)号:CN104794170A

    公开(公告)日:2015-07-22

    申请号:CN201510147426.4

    申请日:2015-03-30

    Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。

    一种高效可扩展的安全的文档相似性计算方法和装置

    公开(公告)号:CN107885705B

    公开(公告)日:2020-12-15

    申请号:CN201710930206.8

    申请日:2017-10-09

    Abstract: 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi‑GBF中,不仅可以确定集合元素是否存在,还可以在查找时返回元素的多个来源ID;不经意多来源混淆布隆过滤器交集计算协议可以高效地在两方之间完成安全的文档相似性计算,又不互相暴露自己的私有数据给对方;采用本发明方法计算文档间的相似性的复杂度与文档集合的大小呈线性关系。

Patent Agency Ranking