一种云计算数据高可用存储压缩方法

    公开(公告)号:CN116962442A

    公开(公告)日:2023-10-27

    申请号:CN202310786494.X

    申请日:2023-06-30

    Inventor: 邬豪峰 黄卫 李斌

    Abstract: 本发明公开了一种云计算数据高可用存储压缩方法,包括重复数据删除,所述重复数据删除包括压缩数据降低冗余度,所述重复数据删除以压缩很少使用的冷门数据的副本来降低由于复制而造成的存储成本和带宽成本,所述压缩数据降低冗余度的方法包括以下步骤:S1、依据数据相似性压缩,S2、增量压缩,S3、当文件更新时;只需将更新后的部分同步到副本节点即可。涉及云存储技术领域,本发明中,通过压缩数据降低冗余度以对重复数据删除,删除文件或文件中相似的块,存储文件的副本和与此文件相似的其他文件的不同部分,以上将会被传输给文件请求用户,压缩很少使用的冷门数据的副本来降低由于复制而造成的存储成本和带宽成本。

    一种基于大数据的数据优化方法
    2.
    发明公开

    公开(公告)号:CN115114274A

    公开(公告)日:2022-09-27

    申请号:CN202210883431.1

    申请日:2022-07-26

    Abstract: 本发明公开了一种基于大数据的数据优化方法,涉及数据通信领域,包括以下步骤,步骤一:对需要进行优化的数据进行清洗,从而输出所需要的业务数据;步骤二:对所述步骤一种的业务数据进行预处理,将具有相同数值属性的数据归类到一个数据子集合中,同时将其从业务数据中筛选出来;步骤三:对所述步骤二中筛选出的数据子集合进行曲线拟合分析,分离出曲线分布近似正态分布曲线的数据子集合,且归为A类,曲线的分布形式近似泊松分布曲线的数据子集合归为B类,本发明通过先对海量的数据进行数据清洗筛选出业务所需的数据,从而剔除无关数据,再对清洗后的数据进行分析优化,从而大大提高了数据分析效率,通过将清洗后的数据进行分块分析,极大的缩短了数据分析的时间,也提高了数据分析的准确性。

Patent Agency Ranking