一种基于共享样本的在线聚集方法

    公开(公告)号:CN110597857B

    公开(公告)日:2023-03-24

    申请号:CN201910811714.3

    申请日:2019-08-30

    Applicant: 南开大学

    Abstract: 一种基于共享样本的在线聚集方法,属于数据库技术应用领域。该方法包括:基于查询子句的特征和数据表特征,在线生成样本表;建立样本缓存池,将创建好的样本存储在样本缓存池中备用;指定共享样本的策略,当新的查询到来时,首先去样本缓存池中查询是否有需要的样本,如果没有的话再创建新的样本。相比于离线采样的方法来说,本发明在创建样本时考虑到了查询的特征,能够使查询所使用的样本更有效。同时,本发明适用于处理多条连续查询,通过样本缓存池存储样本和不同查询之间共享样本,避免重复创建样本,提高了连续查询的查询效率。

    一种基于离线学习历史查询预测未来查询的近似查询方法

    公开(公告)号:CN110597876A

    公开(公告)日:2019-12-20

    申请号:CN201910812371.2

    申请日:2019-08-30

    Applicant: 南开大学

    Abstract: 一种基于离线学习历史查询预测未来查询的近似查询方法,属于数据库技术应用领域。步骤如下:第1、离线学习历史查询对底层数据分布建模,第1.1、将复杂的SQL查询拆分为简单查询;第1.2、提取SQL查询和近似结果中包含的特征;第1.3、利用历史查询、近似结果和真实结果对底层数据分布建模;第2、在线预测新到来查询的结果,第2.1、将新到来的查询拆分为简单查询;第2.2、为每个简单查询在线预测查询结果;第2.3、将简单查询的预测结果合并输出最终的预测结果。本发明可以降低构建底层数据分布模型的复杂度同时提高其精确度,在没有多余时间消耗的情况下可以提高查询的精确度。

    一种基于共享样本的在线聚集方法

    公开(公告)号:CN110597857A

    公开(公告)日:2019-12-20

    申请号:CN201910811714.3

    申请日:2019-08-30

    Applicant: 南开大学

    Abstract: 一种基于共享样本的在线聚集方法,属于数据库技术应用领域。该方法包括:基于查询子句的特征和数据表特征,在线生成样本表;建立样本缓存池,将创建好的样本存储在样本缓存池中备用;指定共享样本的策略,当新的查询到来时,首先去样本缓存池中查询是否有需要的样本,如果没有的话再创建新的样本。相比于离线采样的方法来说,本发明在创建样本时考虑到了查询的特征,能够使查询所使用的样本更有效。同时,本发明适用于处理多条连续查询,通过样本缓存池存储样本和不同查询之间共享样本,避免重复创建样本,提高了连续查询的查询效率。

    一种基于离线学习历史查询预测未来查询的近似查询方法

    公开(公告)号:CN110597876B

    公开(公告)日:2023-03-24

    申请号:CN201910812371.2

    申请日:2019-08-30

    Applicant: 南开大学

    Abstract: 一种基于离线学习历史查询预测未来查询的近似查询方法,属于数据库技术应用领域。步骤如下:第1、离线学习历史查询对底层数据分布建模,第1.1、将复杂的SQL查询拆分为简单查询;第1.2、提取SQL查询和近似结果中包含的特征;第1.3、利用历史查询、近似结果和真实结果对底层数据分布建模;第2、在线预测新到来查询的结果,第2.1、将新到来的查询拆分为简单查询;第2.2、为每个简单查询在线预测查询结果;第2.3、将简单查询的预测结果合并输出最终的预测结果。本发明可以降低构建底层数据分布模型的复杂度同时提高其精确度,在没有多余时间消耗的情况下可以提高查询的精确度。

Patent Agency Ranking