面向海量分布式数据库的批量插入方法

    公开(公告)号:CN105335482A

    公开(公告)日:2016-02-17

    申请号:CN201510660858.5

    申请日:2015-10-14

    CPC classification number: G06F17/30595 G06F17/30557

    Abstract: 本发明公开了一种面向海量分布式数据库的批量插入方法,用于解决现有海量结构化数据存储管理系统OceanBase不支持批量插入功能的技术问题。技术方案是采用多批次循环插入策略以及插入阈值优化策略,首先根据插入条件获取需要插入的数据,然后将获取的数据进行处理,转换为Oceanbase能够识别的插入格式,根据多批次循环插入思想以及批量插入语义构造插入数据计划,利用插入阈值优化策略在执行插入数据计划时进行优化,提高插入效率。海量分布式数据库的批量插入方法在Oceanbase中实现了批量插入功能,性能优于利用程序进行插入的方法。

    面向海量分布式数据库的嵌套查询方法

    公开(公告)号:CN104090962A

    公开(公告)日:2014-10-08

    申请号:CN201410333217.4

    申请日:2014-07-14

    CPC classification number: G06F16/27 G06F16/24553

    Abstract: 本发明公开了一种面向海量分布式数据库的嵌套查询方法,用于解决现有Oceanbase的SQL查询方法中不支持嵌套查询的技术问题。技术方案是通过构建查询树和查询引擎实现嵌套子查询功能。在小数据集查询时,直接绑定子查询结果集到物理计划。当大数据量查询时,启用两阶段过滤策略,使用BloomFilter在ChunkServer上进行初次过滤,过滤后的数据在MergeServer进行二次精确匹配,并采用HashMap来存储需要对比的结果集。由于BloomFilter能快速过滤掉大量无关数据,而HashMap又能快速匹配符合条件的结果集。因此,本发明方法在实现了嵌套查询的基础上,大大提高了SQL查询速度。

    面向海量分布式数据库的批量插入方法

    公开(公告)号:CN105335482B

    公开(公告)日:2018-07-03

    申请号:CN201510660858.5

    申请日:2015-10-14

    Abstract: 本发明公开了一种面向海量分布式数据库的批量插入方法,用于解决现有海量结构化数据存储管理系统OceanBase不支持批量插入功能的技术问题。技术方案是采用多批次循环插入策略以及插入阈值优化策略,首先根据插入条件获取需要插入的数据,然后将获取的数据进行处理,转换为Oceanbase能够识别的插入格式,根据多批次循环插入思想以及批量插入语义构造插入数据计划,利用插入阈值优化策略在执行插入数据计划时进行优化,提高插入效率。海量分布式数据库的批量插入方法在Oceanbase中实现了批量插入功能,性能优于利用程序进行插入的方法。

    面向海量分布式数据库的嵌套查询方法

    公开(公告)号:CN104090962B

    公开(公告)日:2017-03-29

    申请号:CN201410333217.4

    申请日:2014-07-14

    Abstract: 本发明公开了一种面向海量分布式数据库的嵌套查询方法,用于解决现有Oceanbase的SQL查询方法中不支持嵌套查询的技术问题。技术方案是通过构建查询树和查询引擎实现嵌套子查询功能。在小数据集查询时,直接绑定子查询结果集到物理计划。当大数据量查询时,启用两阶段过滤策略,使用BloomFilter在ChunkServer上进行初次过滤,过滤后的数据在MergeServer进行二次精确匹配,并采用HashMap来存储需要对比的结果集。由于BloomFilter能快速过滤掉大量无关数据,而HashMap又能快速匹配符合条件的结果集。因此,本发明方法在实现了嵌套查询的基础上,大大提高了SQL查询速度。

Patent Agency Ranking