-
公开(公告)号:CN113434511B
公开(公告)日:2023-08-29
申请号:CN202110785517.6
申请日:2021-07-12
Applicant: 北京林业大学
IPC: G06F16/22 , G06F16/245
Abstract: 本文公开了一种基于希尔伯特曲线的聚类索引方法。包括以下步骤:读取原数据表中数据;对表中索引数据进行去重,排序;根据索引数据构建关系表和坐标表;将索引数据映射为一维序列值;根据生成序列值和非索引数据构建索引表;进行多条件查询。本文提出的方法使用空间填充曲线中的希尔伯特曲线作为降维方法,相比于Z曲线和G曲线等其它空间填充曲线具有较好的空间连续性和聚类性。通过使用序列值作为行键有效地提高了多维点查询的查询效率,查询效率较HBase原表扫描提升近4倍。本文使用一种全新的希尔伯特曲线子空间划分方法,将HBase表中的数据的过滤转换为希尔伯特曲线中点的过滤,提高了多维范围查询的查询效率,查询效率较HBase原表扫描提升近2倍。
-
公开(公告)号:CN113434511A
公开(公告)日:2021-09-24
申请号:CN202110785517.6
申请日:2021-07-12
Applicant: 北京林业大学
IPC: G06F16/22 , G06F16/245
Abstract: 本文公开了一种基于希尔伯特曲线的聚类索引方法。包括以下步骤:读取原数据表中数据;对表中索引数据进行去重,排序;根据索引数据构建关系表和坐标表;将索引数据映射为一维序列值;根据生成序列值和非索引数据构建索引表;进行多条件查询。本文提出的方法使用空间填充曲线中的希尔伯特曲线作为降维方法,相比于Z曲线和G曲线等其它空间填充曲线具有较好的空间连续性和聚类性。通过使用序列值作为行键有效地提高了多维点查询的查询效率,查询效率较HBase原表扫描提升近4倍。本文使用一种全新的希尔伯特曲线子空间划分方法,将HBase表中的数据的过滤转换为希尔伯特曲线中点的过滤,提高了多维范围查询的查询效率,查询效率较HBase原表扫描提升近2倍。
-