基于硬盘和内存的列式存储和查询方法及设备

    公开(公告)号:CN104715039A

    公开(公告)日:2015-06-17

    申请号:CN201510128015.0

    申请日:2015-03-23

    Inventor: 张常淳

    CPC classification number: G06F17/30315 G06F17/30147 G06F17/30442

    Abstract: 本申请提供一种基于硬盘和内存的列式存储和查询方法及设备,通过创建数据源对应的数据表的元信息,在内存中对数据源创建数据表的结构,根据所述元信息把当前的数据行生成为一个列式数据块并存储到硬盘,能够更加有效地使用内存,实现后续在硬盘上查询数据的性能达到与在内存上查询数据相近的性能,能够进一步支持后续以高速的查询效率为基础的强大的数据分析能力。进一步的,所述列为索引列时,通过对每个索引列建立一个倒排索引,并采用RadixTree结构将索引列存储到固态硬盘的对应位置的文件中,能够提高后续数据查询的效率。

    一种基于索引表的查询的方法及设备

    公开(公告)号:CN106940715B

    公开(公告)日:2019-11-15

    申请号:CN201710138728.4

    申请日:2017-03-09

    Abstract: 本申请的目的是提供一种基于索引表的查询的方法及设备,本申请通过根据用户的查询请求判断所述索引列的值是否为确定值,进而选择对应的索引表,根据所述索引表对应的元信息将所确定的从节点上的索引文件的位置信息发送至所述从节点,并根据所述数据表的元信息将所确定的从节点上的数据文件的位置信息发送至所述从节点。在从节点端,根据所述主节点发送的数据表的元信息中数据文件的位置信息,判断所述从节点中是否存在用户查询请求对应的数据文件,若是,则根据所述索引文件的信息获取所述数据文件,从而满足用户不同的筛选条件,有效地筛选出满足条件的数据文件,大大减少了查询时的数据读取量,缩短查询时间、提高了数据查询的效率。

    一种创建索引表的方法及设备

    公开(公告)号:CN106960020B

    公开(公告)日:2019-10-22

    申请号:CN201710140132.8

    申请日:2017-03-09

    Abstract: 本申请的目的是提供一种创建索引表的方法及设备,本申请通过创建获取到的数据源对应数据表的元信息的结构;接着,创建待创建索引表的数据结构,根据用户的请求确定所述数据表中所述待创建索引表的索引列,并根据所述索引列创建所述待创建索引表对应的元信息的结构;将所述数据源中当前数据行生成的数据文件分配至从节点;将所述待创建索引表的索引文件的信息分配至对应的从节点的索引文件中,进而优化了底层存储结构,当应用于数据查询时,提供索引文件的信息,从而根据索引文件的信息能够快速定位到满足条件的数据文件,大大减少了数据的访问量,提高了查询性能。

    基于硬盘和内存的列式存储和查询方法及设备

    公开(公告)号:CN104715039B

    公开(公告)日:2018-10-19

    申请号:CN201510128015.0

    申请日:2015-03-23

    Inventor: 张常淳

    Abstract: 本申请提供一种基于硬盘和内存的列式存储和查询方法及设备,通过创建数据源对应的数据表的元信息,在内存中对数据源创建数据表的结构,根据所述元信息把当前的数据行生成为一个列式数据块并存储到硬盘,能够更加有效地使用内存,实现后续在硬盘上查询数据的性能达到与在内存上查询数据相近的性能,能够进一步支持后续以高速的查询效率为基础的强大的数据分析能力。进一步的,所述列为索引列时,通过对每个索引列建立一个倒排索引,并采用RadixTree结构将索引列存储到固态硬盘的对应位置的文件中,能够提高后续数据查询的效率。

    一种创建索引表的方法及设备

    公开(公告)号:CN106960020A

    公开(公告)日:2017-07-18

    申请号:CN201710140132.8

    申请日:2017-03-09

    Abstract: 本申请的目的是提供一种创建索引表的方法及设备,本申请通过创建获取到的数据源对应数据表的元信息的结构;接着,创建待创建索引表的数据结构,根据用户的请求确定所述数据表中所述待创建索引表的索引列,并根据所述索引列创建所述待创建索引表对应的元信息的结构;将所述数据源中当前数据行生成的数据文件分配至从节点;将所述待创建索引表的索引文件的信息分配至对应的从节点的索引文件中,进而优化了底层存储结构,当应用于数据查询时,提供索引文件的信息,从而根据索引文件的信息能够快速定位到满足条件的数据文件,大大减少了数据的访问量,提高了查询性能。

    一种基于索引表的查询的方法及设备

    公开(公告)号:CN106940715A

    公开(公告)日:2017-07-11

    申请号:CN201710138728.4

    申请日:2017-03-09

    Abstract: 本申请的目的是提供一种基于索引表的查询的方法及设备,本申请通过根据用户的查询请求判断所述索引列的值是否为确定值,进而选择对应的索引表,根据所述索引表对应的元信息将所确定的从节点上的索引文件的位置信息发送至所述从节点,并根据所述数据表的元信息将所确定的从节点上的数据文件的位置信息发送至所述从节点。在从节点端,根据所述主节点发送的数据表的元信息中数据文件的位置信息,判断所述从节点中是否存在用户查询请求对应的数据文件,若是,则根据所述索引文件的信息获取所述数据文件,从而满足用户不同的筛选条件,有效地筛选出满足条件的数据文件,大大减少了查询时的数据读取量,缩短查询时间、提高了数据查询的效率。

Patent Agency Ranking