-
公开(公告)号:CN117194440B
公开(公告)日:2024-02-13
申请号:CN202311479042.3
申请日:2023-11-08
Applicant: 本原数据(北京)信息技术有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22
Abstract: 本申请公开了数据库索引压缩方法、装置、电子设备及存储介质,涉及索引技术领域。通过获取包括多个叶子节点的索引树,对叶子节点列表中叶子节点提取公共前缀。在叶子节点列表中确定初始滑窗的第一边界和第二边界,并计算第一收益,根据第二边界移动至下一个索引值得到的预设边界计算第二收益。若第二收益大于或等于第一收益,则满足预设条件,对第二边界进行更新得到第二滑窗。将第二滑窗作为初始滑窗,迭代执行上述过程,直至不满足预设条件,从而获取初始滑窗的公共前缀。利用公共前缀对初始滑窗中叶子节点的索引值进行压缩。由此通过设置滑窗并根据收益更新滑窗,利用不同的公共前缀压缩不同滑窗中的索引值,有效提高了数据库索引压缩率。
-
公开(公告)号:CN116996077A
公开(公告)日:2023-11-03
申请号:CN202310953173.4
申请日:2023-07-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H03M7/40
Abstract: 本申请实施例公开了面向时序浮点数据的有损压缩方法、解压方法及设备,用于提升时序浮点数据的数据压缩率以及解压速度。本申请实施例方法包括:获取浮点数组,浮点数组包括依时序排列的多个浮点数据;依次将浮点数组中其他浮点数据确定为目标浮点数据,并从浮点数组中确定目标浮点数据的前一浮点数据;将目标浮点数据与前一浮点数据之差,确定为目标浮点数据的差量数据;基于预设误差界对差量数据进行量化处理,获得目标浮点数据对应的量化差量数据,目标浮点数据对应的有损数据与目标浮点数据之差不大于预设误差界,目标浮点数据对应的有损数据通过对目标浮点数据对应的量化差量数据执行反差量化处理得到;对每个量化差量数据进行压缩处理。
-
公开(公告)号:CN119719054A
公开(公告)日:2025-03-28
申请号:CN202411781662.7
申请日:2024-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/174 , H03M7/30 , H03M7/40 , G06F18/2323
Abstract: 本申请实施例公开了数据压缩方法及相关装置。本申请实施例方法包括:通过遍历每个分组下待压缩数据中的各个数据单元,计算各个数据单元之间的相似度;根据各个数据单元之间的相似度,确定各个数据单元之间的依赖关系;根据各个数据单元之间的依赖关系,生成依赖关系树;对依赖关系树利用图遍历算法生成各个数据单元的排序结果;基于各个数据单元的排序结果,确定每个分组中各个数据单元的排列顺序,并对每个分组下的待压缩数据进行数据压缩。本申请通过计算数据单元间的相似度并生成依赖关系树,能够挖掘数据间的潜在关联性;通过对依赖关系树利用图遍历算法生成的排序结果来优化数据单元的排列顺序,能够进一步压缩冗余信息,提升数据压缩率。
-
公开(公告)号:CN117194440A
公开(公告)日:2023-12-08
申请号:CN202311479042.3
申请日:2023-11-08
Applicant: 本原数据(北京)信息技术有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22
Abstract: 本申请公开了数据库索引压缩方法、装置、电子设备及存储介质,涉及索引技术领域。通过获取包括多个叶子节点的索引树,对叶子节点列表中叶子节点提取公共前缀。在叶子节点列表中确定初始滑窗的第一边界和第二边界,并计算第一收益,根据第二边界移动至下一个索引值得到的预设边界计算第二收益。若第二收益大于或等于第一收益,则满足预设条件,对第二边界进行更新得到第二滑窗。将第二滑窗作为初始滑窗,迭代执行上述过程,直至不满足预设条件,从而获取初始滑窗的公共前缀。利用公共前缀对初始滑窗中叶子节点的索引值进行压缩。由此通过设置滑窗并根据收益更新滑窗,利用不同的公共前缀压缩不同滑窗中的索引值,有效提高了数据库索引压缩率。
-
-
-