一种处理数据的方法及装置

    公开(公告)号:CN103544275A

    公开(公告)日:2014-01-29

    申请号:CN201310499196.9

    申请日:2013-10-22

    CPC classification number: G06F16/285 G06F16/215

    Abstract: 本申请公开了一种处理数据的方法及装置,用以解决现有技术对海量的原始数据进行聚类分类处理而造成的系统工作量繁重的问题,该方法包括:对原始文件进行重复数据删除处理,获得重复数据删除处理后的文件的元数据;根据所述元数据对所述重复数据删除处理后的文件进行聚类和分类中的至少一种处理。

    一种数据分片方法、相关设备及计算机存储介质

    公开(公告)号:CN110851525A

    公开(公告)日:2020-02-28

    申请号:CN201810824276.X

    申请日:2018-07-24

    Inventor: 毕杰山 钟延辉

    Abstract: 本发明实施例提供了一种数据分片方法及相关设备,该方法通过配置对用户数据中关键字进行截取的截取方式,根据所述截取方式对获取的用户数据中的关键字进行截取,从而得到目标字段,然后根据哈希算法确定所述目标字段的目标特征值;然后根据所述目标字段的目标特征值,向所述目标特征值对应的存储节点发送所述用户数据,其中,不同的存储节点对应不同的特征值范围,所述目标特征值属于其中一个特征值范围。通过实施该方法,能够在无schema的数据库系统中,既能够使数据均匀的分配到各存储节点中,同时也可以将目标特征值相邻的用户数据存储在相同或者相邻的存储节点中。

    分布式锁服务的方法和装置

    公开(公告)号:CN105631023B

    公开(公告)日:2019-03-26

    申请号:CN201511019966.0

    申请日:2015-12-30

    Inventor: 钟延辉 邓荣峰

    Abstract: 本发明实施例提供一种分布式锁服务方法和装置。该方法包括,接收数据操作请求;确定与该数据操作请求对应的目标互联网协议IP盘;从该目标IP盘中的锁管理服务端DLMS获取与该数据操作请求对应的目标分布式锁;从该目标IP盘中获取目标数据,以便于在该目标分布式锁的租约期限内对该目标数据进行处理。本发明实施例能减少物理部署,降低分布式系统的复杂度。

    一种数据处理方法及数据处理设备

    公开(公告)号:CN109213621A

    公开(公告)日:2019-01-15

    申请号:CN201710553141.X

    申请日:2017-07-07

    Abstract: 本文公开了一种数据处理方法及数据处理设备,该方法包括:确定至少两个第一待校验数据块,所述至少两个第一待校验数据块分别所属的备副本数据来自不同的数据中心;将所述至少两个第一待校验数据块进行校验处理,得到第一校验数据;将所述第一校验数据存储至第一聚合数据块;其中,所述第一聚合数据块包含有第二校验数据;建立所述第一聚合数据块至所述第一校验数据的反向索引和所述第一聚合数据块至所述第二校验数据的反向索引;将所述第一聚合数据块写入存储单元,从而精简备副本数据的元数据的结构,有利于该元数据进行缓存,并能够提升数据处理效率。

    基于重复数据删除的远程复制方法及装置

    公开(公告)号:CN104484480B

    公开(公告)日:2018-06-05

    申请号:CN201410854706.4

    申请日:2014-12-31

    Inventor: 钟延辉 张程伟

    Abstract: 本发明实施例提供一种基于重复数据删除的远程复制方法及装置。本发明基于重复数据删除的远程复制方法,应用于远程复制系统中,所述系统包括:主端设备和容灾端设备,所述主端设备和所述容灾端设备均存储第一快照,所述方法包括:主端设备获取所述主端设备的第二快照;所述主端设备判断所述第二快照中相对第一快照增加的数据块的指纹是否与所述第一快照中的数据块的指纹相同;当所述增加的数据块中的第一数据块的指纹与所述第一快照中的数据块的指纹不同,将所述第一数据块、所述第一数据块的指纹和所述增加的数据块的元数据发送给所述容灾端设备。本发明实施例提高了远程复制容灾备份的性能。

    重复数据删除方法及装置
    26.
    发明授权

    公开(公告)号:CN104408154B

    公开(公告)日:2018-05-29

    申请号:CN201410729944.2

    申请日:2014-12-04

    Inventor: 余健 钟延辉

    Abstract: 本发明实施例公开了一种重复数据删除方法及装置。其中,重复数据删除方法,包括:将接收到的初始数据进行分块;获得每个数据分块的指纹;根据所有所述数据分块的指纹,生成所述初始数据的第一校验值;查找所述初始数据中的重复数据分块,删除所述重复数据分块;存储删除重复数据分块后的唯一块;根据所有所述唯一块的指纹,采用与所述第一校验值相同的生成方式,生成当前完成重复数据删除后数据的第二校验值;比较所述第一校验值和所述第二校验值,当所述第一校验值和所述第二校验值一致时,确定所述初始数据经过正确重复数据删除。通过本发明实施例,能够为重复数据删除过程中数据的准确性提供保证。

    小文件处理方法及装置
    27.
    发明授权

    公开(公告)号:CN103514210B

    公开(公告)日:2017-06-27

    申请号:CN201210217046.X

    申请日:2012-06-28

    CPC classification number: G06F17/30117

    Abstract: 本发明所提供的小文件处理方法,针对海量小文件的重复数据删除的处理,将小文件整合为一个大文件后,对整合后的大文件整体进行分块后,在分块的过程中,如果当前正在划分的数据块中,包括了任一个小文件的尾部时,需要以这个小文件的尾部作为当前数据分块的结束位置,对整合后的大文件分块完成后再作重复数据查找等操作,提高了小文件的重复数据删除效率。

    数据存储方法及装置
    28.
    发明公开

    公开(公告)号:CN106201338A

    公开(公告)日:2016-12-07

    申请号:CN201610481388.0

    申请日:2016-06-28

    Inventor: 钟延辉

    Abstract: 本发明公开一种数据存储方法及装置,应用于包括计算节点和多个存储节点的分布式存储系统,该方法包括:计算节点接收携带待存储数据的数据存储请求;确定存储待存储数据的哈希分区,哈希分区中包含分别属于两个不同数据中心的两个存储节点组;每个存储节点组包含R个存储节点,R为大于2的整数;将待存储数据划分为N个数据分片并获得N个数据分片的M个校验分片,N+M=R;将N个数据分片及M个校验分片分别写入每个存储节点组的R个存储节点。本发明的技术方案在任一数据中心出现写入分片失败且写入失败分片数量小于或等于M时,可根据写入成功的分片修复写入失败的分片,所以本发明的技术方案提高了数据中心中的数据的可靠性和稳定性。

    分布式锁服务的方法和装置

    公开(公告)号:CN105631023A

    公开(公告)日:2016-06-01

    申请号:CN201511019966.0

    申请日:2015-12-30

    Inventor: 钟延辉 邓荣峰

    CPC classification number: G06F17/30165 G06F9/547 G06F2209/541

    Abstract: 本发明实施例提供一种分布式锁服务方法和装置。该方法包括,接收数据操作请求;确定与该数据操作请求对应的目标互联网协议IP盘;从该目标IP盘中的锁管理服务端DLMS获取与该数据操作请求对应的目标分布式锁;从该目标IP盘中获取目标数据,以便于在该目标分布式锁的租约期限内对该目标数据进行处理。本发明实施例能减少物理部署,降低分布式系统的复杂度。

    灾备端、生产端及两者之间的数据恢复方法

    公开(公告)号:CN105487940A

    公开(公告)日:2016-04-13

    申请号:CN201510802397.0

    申请日:2015-11-18

    CPC classification number: G06F11/1448

    Abstract: 本发明提供一种灾备端、生产端及两者之间的数据恢复方法。所述方法包括:灾备端周期性的为生产端中的数据生成副本,并存储周期性生成的副本,其中所述数据包括源数据及源数据的差量数据;灾备端选取被存储的副本,并利用其恢复对应的数据,以代替生产端执行其功能,其中所述被选取的副本包括最新生成的副本及在最新生成的副本之前生成的副本。本发明由灾备端一个系统融合容灾和备份这两种功能,能够降低购买和维护成本、提高存储空间的利用率。

Patent Agency Ranking