一种并行重复数据删除方法

    公开(公告)号:CN103970875A

    公开(公告)日:2014-08-06

    申请号:CN201410204599.0

    申请日:2014-05-15

    CPC classification number: G06F17/30159 G06F17/30168 G06F17/30203

    Abstract: 本发明公开了一种并行重复数据删除方法,包括以下步骤:客户端先对要重删的数据进行分块,然后通过哈希函数计算出每个分块的哈希指纹,然后把哈希指纹发送到不同的重删服务器节点上进行指纹的查重工作。如果某个指纹经过对比,确认是重复的指纹,则只用更新查询服务器上元数据和重删服务器节点上的指纹计数器。如果某个指纹经过对比,确认是一个新的数据块,则传输该数据块到重删服务器并且更新指纹库和查询服务器上的元数据。本发明具重删节点可扩展性,可根据不同的需求扩展不同的节点来满足性能的需求,而且利用了多节点之间的并行性,有效的提升了重删系统的性能,提供高效可靠的服务。

    多层BloomFilter的构建及查询优化方法

    公开(公告)号:CN102799617A

    公开(公告)日:2012-11-28

    申请号:CN201210202816.3

    申请日:2012-06-19

    Abstract: 本发明公开了一种多层Bloom Filter的构建及查询优化方法,构建时,对现有多层Bloom Filter中各层相关Bloom Filter的bit位进行重新放置,将第一层Q个Bloom Filter以及上层每一个Bloom Filter对应的下层Q个Bloom Filter的相同位置bit位放在同一连续地址空间;查询时,一个哈希值对应同层Q个Bloom Filter的bit位存在于同一连续地址空间,通过对少数连续空间的查询即可实现对进行多层Bloom Filter的查询。本发明优化后的多层Bloom Filter在不增加存储空间的基础上,相应bit位查询操作更为简便,大大减少了磁盘访问的次数,有效减少了对多层Bloom Filter的查询时间。

    多层BloomFilter的构建及查询优化方法

    公开(公告)号:CN102799617B

    公开(公告)日:2014-09-24

    申请号:CN201210202816.3

    申请日:2012-06-19

    Abstract: 本发明公开了一种多层Bloom Filter的构建及查询优化方法,构建时,对现有多层Bloom Filter中各层相关Bloom Filter的bit位进行重新放置,将第一层Q个Bloom Filter以及上层每一个Bloom Filter对应的下层Q个Bloom Filter的相同位置bit位放在同一连续地址空间;查询时,一个哈希值对应同层Q个Bloom Filter的bit位存在于同一连续地址空间,通过对少数连续空间的查询即可实现对进行多层Bloom Filter的查询。本发明优化后的多层Bloom Filter在不增加存储空间的基础上,相应bit位查询操作更为简便,大大减少了磁盘访问的次数,有效减少了对多层Bloom Filter的查询时间。

    一种并行重复数据删除方法和系统

    公开(公告)号:CN103970875B

    公开(公告)日:2017-02-15

    申请号:CN201410204599.0

    申请日:2014-05-15

    Abstract: 本发明公开了一种并行重复数据删除方法,包括以下步骤:客户端先对要重删的数据进行分块,然后通过哈希函数计算出每个分块的哈希指纹,然后把哈希指纹发送到不同的重删服务器节点上进行指纹的查重工作。如果某个指纹经过对比,确认是重复的指纹,则只用更新查询服务器上元数据和重删服务器节点上的指纹计数器。如果某个指纹经过对比,确认是一个新的数据块,则传输该数据块到重删服务器并且更新指纹库和查询服务器上的元数据。本发明具重删节点可扩展性,可根据不同的需求扩展不同的节点来满足性能的需求,而且利用了多节点之间的并行性,有效的提升了重删系统的性能,提供高效可靠的服务。

    一种多层BloomFilter的优化方法及查询方法

    公开(公告)号:CN102968467A

    公开(公告)日:2013-03-13

    申请号:CN201210447165.4

    申请日:2012-11-10

    Abstract: 本发明公开了一种多层Bloom Filter的优化方法,包括以下步骤:根据总数据集的大小S确定Bloom Filter的层数N、第一层Bloom Filter个数Q以及底层每个Bloom Filter对应数据集的数据个数M,并设置计数器i=0,判断多层Bloom Filter的构造是否完毕,若未完毕,则接收新数据,判断底层第i个Bloom Filter对应数据集的数据个数是否等于M,若不等于,则使用哈希函数组对新数据进行哈希计算以得到哈希值,将底层Bloom Filter第i个Bloom Filter中与哈希值对应的比特位置1,并对底层Bloom Filter上面的各N-1层进行置位。本发明的方法使比特位查询操作更为简便,大大减少了磁盘访问的次数,有效减少了对多层Bloom Filter的查询时间。

Patent Agency Ranking