-
公开(公告)号:CN117591548A
公开(公告)日:2024-02-23
申请号:CN202311347674.4
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06F16/2453 , G06F16/2455 , G06F16/242 , G06F16/2458
Abstract: 本发明公开了一种基于优化器的流式SQL执行计划优化方法,包括:针对具有历史输入的数据源流,收集所需的统计信息,并实现基于成本的规则,使优化器能够生成多种执行计划;构建符合流式计算的成本模型,并采用收集的统计信息,对优化器基于成本的规则生成的多种执行计划进行成本的计算,并根据计算的成本对比选出成本最小的最终执行计划;得到最终执行计划,进行最终流式SQL的执行。本发明提出的成本模型考虑CPU、I/O、内存和网络传输开销,并且更加符合流式计算的实际执行过程,综合考虑了流式计算特有的状态管理的成本开销,使得成本计算更加精准,能够选择执行性能较高、计算资源较少的执行计划进行执行。