-
公开(公告)号:CN108920695B
公开(公告)日:2019-09-10
申请号:CN201810771160.4
申请日:2018-07-13
Applicant: 星环信息科技(上海)有限公司
IPC: G06F16/27 , G06F16/2453
Abstract: 本发明公开了一种数据查询方法、装置、设备及存储介质。其中,该方法包括:根据数据查询请求生成过滤条件,并获取数据库中的目标文件;确定目标文件中受到第二增量文件影响的目标数据块,第二增量文件为包括修改操作信息的增量文件;根据过滤条件对目标文件中除目标数据块之外的数据块进行过滤,得到过滤结果;对目标数据块和数据库中除目标文件之外的文件,直接进行读取,得到读取结果;根据过滤条件对过滤结果和读取结果进行再次过滤,生成最终查询结果。本发明实施例的技术方案可以在数据查询的读取文件阶段根据修改操作信息对文件进行过滤,保证查询结果的正确性的同时,减少不必要的数据读取,提高查询性能。
-
公开(公告)号:CN109558232A
公开(公告)日:2019-04-02
申请号:CN201811436295.1
申请日:2018-11-28
Applicant: 星环信息科技(上海)有限公司
Abstract: 本发明实施例公开了一种并行度的确定方法、装置、设备及介质。该方法包括:获取分布式计算任务的执行计划树;根据预设的代价模型以及所述分布式计算任务的数据统计信息分别确定与执行计划树中各节点对应的操作的并行度影响因子;根据预设的代价模型以及分布式计算任务的数据统计信息,确定执行计划树中扫表操作的初始并行度;根据扫表操作的初始并行度,按照后序遍历顺序,根据与执行计划树中各节点对应的操作的并行度影响因子,分别计算与执行计划树中各节点对应的操作的并行度。上述方法避免了现有技术中并行度控制方案的弊端,提高了分布式计算引擎的性能、稳定性和可用性,实现了并行度控制的自适应。
-
公开(公告)号:CN107239541A
公开(公告)日:2017-10-10
申请号:CN201710409673.6
申请日:2017-06-02
Applicant: 星环信息科技(上海)有限公司
IPC: G06F17/30
Abstract: 本申请的目的是提供一种代价估计的方法及设备,本申请通过根据操作树的操作类型确定对应的代价估计方式,基于所述代价估计方式及获取到的原始统计信息确定所述操作类型的代价估计;确定待调整的代价估计,基于所述待调整的代价估计对应的操作类型确定调整因子,根据所述调整因子调整所述待调整的代价估计;根据未调整的代价估计及调整后的代价估计确定所述操作树的累积代价估计,解决了传统代价优化器存在的统计信息的完备性和代价估算的准确性之间的矛盾;通过矫正代价估计,提高代价优化器代价估计的准确性,从而生成性能更好的执行计划。
-
公开(公告)号:CN107239541B
公开(公告)日:2020-02-14
申请号:CN201710409673.6
申请日:2017-06-02
Applicant: 星环信息科技(上海)有限公司
IPC: G06F16/2453
Abstract: 本申请的目的是提供一种代价估计的方法及设备,本申请通过根据操作树的操作类型确定对应的代价估计方式,基于所述代价估计方式及获取到的原始统计信息确定所述操作类型的代价估计;确定待调整的代价估计,基于所述待调整的代价估计对应的操作类型确定调整因子,根据所述调整因子调整所述待调整的代价估计;根据未调整的代价估计及调整后的代价估计确定所述操作树的累积代价估计,解决了传统代价优化器存在的统计信息的完备性和代价估算的准确性之间的矛盾;通过矫正代价估计,提高代价优化器代价估计的准确性,从而生成性能更好的执行计划。
-
公开(公告)号:CN109558232B
公开(公告)日:2019-08-23
申请号:CN201811436295.1
申请日:2018-11-28
Applicant: 星环信息科技(上海)有限公司
Abstract: 本发明实施例公开了一种并行度的确定方法、装置、设备及介质。该方法包括:获取分布式计算任务的执行计划树;根据预设的代价模型以及所述分布式计算任务的数据统计信息分别确定与执行计划树中各节点对应的操作的并行度影响因子;根据预设的代价模型以及分布式计算任务的数据统计信息,确定执行计划树中扫表操作的初始并行度;根据扫表操作的初始并行度,按照后序遍历顺序,根据与执行计划树中各节点对应的操作的并行度影响因子,分别计算与执行计划树中各节点对应的操作的并行度。上述方法避免了现有技术中并行度控制方案的弊端,提高了分布式计算引擎的性能、稳定性和可用性,实现了并行度控制的自适应。
-
公开(公告)号:CN106611044A
公开(公告)日:2017-05-03
申请号:CN201611109489.1
申请日:2016-12-02
Applicant: 星环信息科技(上海)有限公司
IPC: G06F17/30
Abstract: 本申请的目的是提供一种SQL优化方法及设备,本申请通过对获取的该至少两条SQL语句进行分析并提取,得到SQL语句的基本信息、每一条SQL语句对应的表及其表的列的对应关系;基于该SQL语句的基本信息、SQL语句对应的表及其表的列的对应关系,删除所述SQL语句中的无用表,得到初步过滤表后的SQL语句;删除初步过滤表后的SQL语句中的表对应的无用列,得到优化后的SQL语句,实现了从至少两条SQL语句及SQL语句对应的表及其表的列的对应关系的基础上,来对多条SQL语句进行预先优化,不仅达到了对每一条SQL语句进行优化的目的,还提高了整体SQL优化效果,进而节省了现有技术中的预先计算的资源额外开销。
-
公开(公告)号:CN108090224B
公开(公告)日:2020-05-08
申请号:CN201810011679.2
申请日:2018-01-05
Applicant: 星环信息科技(上海)有限公司
IPC: G06F16/22
Abstract: 本申请的目的是提供一种级联连接方法,本申请通过分别确定与事实表级联连接的至少一个维度表的过滤率,以得到与事实表级联连接的每个维度表的过滤率;基于每个维度表的过滤率,分别得到至少一个维度表对应的连接顺序和事实表的过滤条件,使得基于每个维度表得到的事实表的过滤条件更准确高效;依序基于过滤条件及连接顺序依序对应的每个维度表,对事实表中的所有行进行过滤,得到事实表中的过滤后的至少一行;最后,再将事实表中的过滤后的每一行,按照连接顺序,分别与对应的每个维度表中的匹配行进行连接后,生成级联连接结果,避免了在级联接连的过程中生成额外的中间连接结果,进而提高数据库中的事实表与维度表之间的级联连接的性能。
-
公开(公告)号:CN106611044B
公开(公告)日:2020-05-08
申请号:CN201611109489.1
申请日:2016-12-02
Applicant: 星环信息科技(上海)有限公司
IPC: G06F16/2453 , G06F16/242
Abstract: 本申请的目的是提供一种SQL优化方法及设备,本申请通过对获取的该至少两条SQL语句进行分析并提取,得到SQL语句的基本信息、每一条SQL语句对应的表及其表的列的对应关系;基于该SQL语句的基本信息、SQL语句对应的表及其表的列的对应关系,删除所述SQL语句中的无用表,得到初步过滤表后的SQL语句;删除初步过滤表后的SQL语句中的表对应的无用列,得到优化后的SQL语句,实现了从至少两条SQL语句及SQL语句对应的表及其表的列的对应关系的基础上,来对多条SQL语句进行预先优化,不仅达到了对每一条SQL语句进行优化的目的,还提高了整体SQL优化效果,进而节省了现有技术中的预先计算的资源额外开销。
-
公开(公告)号:CN107885865B
公开(公告)日:2019-12-10
申请号:CN201711175349.9
申请日:2017-11-22
Applicant: 星环信息科技(上海)有限公司
IPC: G06F16/2453
Abstract: 本申请的目的是提供一种代价优化器与代价估计的方法及其设备,本申请通过判断获取到的统计信息是否完备,若否,则根据依赖于所述统计信息的操作树的操作类型确定对应的代价估计方式;基于所述代价估计方式确定所述对应操作类型的代价估计;根据依赖于所述统计信息操作类型对应的代价估计及未依赖于统计信息的操作类型对应的代价估计确定所述操作树的累积代价估计。从而对于运行时创建临时表和子查询可以进行代价估算,实现对海量数据的场景不受数据规模限制。
-
公开(公告)号:CN108920695A
公开(公告)日:2018-11-30
申请号:CN201810771160.4
申请日:2018-07-13
Applicant: 星环信息科技(上海)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据查询方法、装置、设备及存储介质。其中,该方法包括:根据数据查询请求生成过滤条件,并获取数据库中的目标文件;确定目标文件中受到第二增量文件影响的目标数据块,第二增量文件为包括修改操作信息的增量文件;根据过滤条件对目标文件中除目标数据块之外的数据块进行过滤,得到过滤结果;对目标数据块和数据库中除目标文件之外的文件,直接进行读取,得到读取结果;根据过滤条件对过滤结果和读取结果进行再次过滤,生成最终查询结果。本发明实施例的技术方案可以在数据查询的读取文件阶段根据修改操作信息对文件进行过滤,保证查询结果的正确性的同时,减少不必要的数据读取,提高查询性能。
-
-
-
-
-
-
-
-
-