一种基于BERT的数据库查询连接顺序调整方法

    公开(公告)号:CN117033416B

    公开(公告)日:2024-08-09

    申请号:CN202311056356.2

    申请日:2023-08-21

    Applicant: 宁夏大学

    Abstract: 本发明提供基于BERT的数据库查询连接顺序调整方法,属于数据库查询优化技术领域。包括:利用SQL生成器生成SQL集合A={α};基于SQL集合A生成训练集、验证集和测试集,利用学习式连接顺序调整模型对训练集Ma进行调整,调整后得到的查询集Ma′;将查询集Ma′中各元素编码为文本向量;将文本向量编辑成为输入向量,将|Ma′|个输入向量输入BERT模型进行预训练,通过调整权重矩阵;利用验证集Mb、结合对比调优模型验证BERT模型,出现调优效果不优于对比调优模型的情况时,对权重矩阵执行fine‑tuning操作;利用测试集Mc、结合对比调优模型测试BERT模型,测试完成后调优效果全部优于对比调优模型,训练结束;利用训练好的BERT模型执行新查询的查询连接顺序优化调整。

    基于数据剪枝提升等值连接查询性能的方法、装置及设备

    公开(公告)号:CN115470231A

    公开(公告)日:2022-12-13

    申请号:CN202211170038.4

    申请日:2022-09-22

    Applicant: 宁夏大学

    Abstract: 本发明提供基于数据剪枝提升等值连接查询性能的方法、装置及设备,属于数据库查询技术领域。方法包括:步骤S1,获取多路等值连接查询操作所涉及的所有表、以及各个所述表之间的连接关系,所述连接关系包括对应关系和连接属性;步骤S2,根据所有所述表、以及所述对应连接属性,生成N个独立的传递闭包;步骤S3,令所述传递闭包作为具有M个剪枝元素PE的剪枝单元PU,对所述传递闭包实施两段剪枝操作,得到两段剪枝后的传递闭包;步骤S4,基于所有所述两段剪枝后的传递闭包执行所述多路等值连接查询操作。

    基于旋钮剪枝的数据库参数调优方法、设备及存储介质

    公开(公告)号:CN116881227B

    公开(公告)日:2024-07-19

    申请号:CN202310920218.8

    申请日:2023-07-25

    Applicant: 宁夏大学

    Abstract: 本发明提供基于旋钮剪枝的数据库参数调优方法、设备及存储介质,属于数据库领域参数调优技术领域。包括:在数据库配置文件中提取数据构造旋钮集DKN,DKN={(kname,type,Θ,kdata)};根据数据库中的SQL命令构建指标集M,基于所述指标集M和所述旋钮集DKN构建矩阵,利用因子分析方法将高维DBMS旋钮转换为低维数据,利用k‑means聚类方法聚类低维数据,删减掉冗余旋钮、更新DKN;将更新后的DKN降维处理成d个合成旋钮,基于各所述合成旋钮通过填充采样方法生成初始点集p输入至贝叶斯优化模型,得到合成旋钮集合;利用所述合成旋钮集合更新所述步骤S2的DKN中各元素的kdata,得到剪枝后的旋钮配置集合。

    基于因果推理的数据库基数估计方法、设备及存储介质

    公开(公告)号:CN116521723B

    公开(公告)日:2024-08-06

    申请号:CN202310491148.9

    申请日:2023-05-04

    Applicant: 宁夏大学

    Abstract: 本发明提供一种基于因果推理的数据库基数估计方法、设备及存储介质,属于数据库领域查询优化技术领域。包括:将查询集△中每一个查询通过SQL命令explain analyze打印成对应的物理计划树,然后将各个物理计划树规范化,并将所得的规范化记录存储至集合△';基于集合△'中各规范化记录构造素材图Gfinal,其中,素材图Gfinal中的顶点用于表示物理算子、边用于表示两端物理算子之间的关系,素材图Gfinal中具有相同算子属性的两个物理算子之间的边为双向边,算子属性包括表及表属性;将素材图Gfinal中的顶点变量化,得到因果概率图Gprob;利用因果概率图Gprob对给定的新查询进行因果式基数估计。

    基于数据剪枝提升等值连接查询性能的方法、装置及设备

    公开(公告)号:CN115470231B

    公开(公告)日:2024-07-19

    申请号:CN202211170038.4

    申请日:2022-09-22

    Applicant: 宁夏大学

    Abstract: 本发明提供基于数据剪枝提升等值连接查询性能的方法、装置及设备,属于数据库查询技术领域。方法包括:步骤S1,获取多路等值连接查询操作所涉及的所有表、以及各个所述表之间的连接关系,所述连接关系包括对应关系和连接属性;步骤S2,根据所有所述表、以及所述对应连接属性,生成N个独立的传递闭包;步骤S3,令所述传递闭包作为具有M个剪枝元素PE的剪枝单元PU,对所述传递闭包实施两段剪枝操作,得到两段剪枝后的传递闭包;步骤S4,基于所有所述两段剪枝后的传递闭包执行所述多路等值连接查询操作。

    基于规则剪枝的查询重写方法、系统、设备及存储介质

    公开(公告)号:CN116680298B

    公开(公告)日:2024-08-06

    申请号:CN202310658824.7

    申请日:2023-06-05

    Applicant: 宁夏大学

    Abstract: 本发明提供基于规则剪枝的查询重写方法、系统、设备及存储介质,属于数据库领域查询优化技术领域。包括:向数据库输入一个待重写的SQL类型的查询语句o1;将所述查询语句o1和原始重写规则全集Y输入到规则剪枝模型,得到一个优质规则集Ro1;根据所述查询语句o1和所述优质规则集Ro1,构建策略树;利用蒙特卡洛树搜索算法对所述策略树进行搜索,基于最优搜索路径得出最优重写顺序;基于所述最优重写顺序对所述查询语句o1进行查询重组,构造出所述查询语句o1的重写语句o2。

    基于旋钮剪枝的数据库参数调优方法、设备及存储介质

    公开(公告)号:CN116881227A

    公开(公告)日:2023-10-13

    申请号:CN202310920218.8

    申请日:2023-07-25

    Applicant: 宁夏大学

    Abstract: 本发明提供基于旋钮剪枝的数据库参数调优方法、设备及存储介质,属于数据库领域参数调优技术领域。包括:在数据库配置文件中提取数据构造旋钮集DKN,DKN={(kname,type,Θ,kdata)};根据数据库中的SQL命令构建指标集M,基于所述指标集M和所述旋钮集DKN构建矩阵,利用因子分析方法将高维DBMS旋钮转换为低维数据,利用k‑means聚类方法聚类低维数据,删减掉冗余旋钮、更新DKN;将更新后的DKN降维处理成d个合成旋钮,基于各所述合成旋钮通过填充采样方法生成初始点集p输入至贝叶斯优化模型,得到合成旋钮集合;利用所述合成旋钮集合更新所述步骤S2的DKN中各元素的kdata,得到剪枝后的旋钮配置集合。

    一种基于BERT的数据库查询连接顺序调整方法

    公开(公告)号:CN117033416A

    公开(公告)日:2023-11-10

    申请号:CN202311056356.2

    申请日:2023-08-21

    Applicant: 宁夏大学

    Abstract: 本发明提供基于BERT的数据库查询连接顺序调整方法,属于数据库查询优化技术领域。包括:利用SQL生成器生成SQL集合A={α};基于SQL集合A生成训练集、验证集和测试集,利用学习式连接顺序调整模型对训练集Ma进行调整,调整后得到的查询集Ma′;将查询集Ma′中各元素编码为文本向量;将文本向量编辑成为输入向量,将|Ma′|个输入向量输入BERT模型进行预训练,通过调整权重矩阵;利用验证集Mb、结合对比调优模型验证BERT模型,出现调优效果不优于对比调优模型的情况时,对权重矩阵执行fine‑tuning操作;利用测试集Mc、结合对比调优模型测试BERT模型,测试完成后调优效果全部优于对比调优模型,训练结束;利用训练好的BERT模型执行新查询的查询连接顺序优化调整。

    基于规则剪枝的查询重写方法、系统、设备及存储介质

    公开(公告)号:CN116680298A

    公开(公告)日:2023-09-01

    申请号:CN202310658824.7

    申请日:2023-06-05

    Applicant: 宁夏大学

    Abstract: 本发明提供基于规则剪枝的查询重写方法、系统、设备及存储介质,属于数据库领域查询优化技术领域。包括:向数据库输入一个待重写的SQL类型的查询语句o1;将所述查询语句o1和原始重写规则全集Y输入到规则剪枝模型,得到一个优质规则集Ro1;根据所述查询语句o1和所述优质规则集Ro1,构建策略树;利用蒙特卡洛树搜索算法对所述策略树进行搜索,基于最优搜索路径得出最优重写顺序;基于所述最优重写顺序对所述查询语句o1进行查询重组,构造出所述查询语句o1的重写语句o2。

    基于因果推理的数据库基数估计方法、设备及存储介质

    公开(公告)号:CN116521723A

    公开(公告)日:2023-08-01

    申请号:CN202310491148.9

    申请日:2023-05-04

    Applicant: 宁夏大学

    Abstract: 本发明提供一种基于因果推理的数据库基数估计方法、设备及存储介质,属于数据库领域查询优化技术领域。包括:将查询集△中每一个查询通过SQL命令explain analyze打印成对应的物理计划树,然后将各个物理计划树规范化,并将所得的规范化记录存储至集合△';基于集合△'中各规范化记录构造素材图Gfinal,其中,素材图Gfinal中的顶点用于表示物理算子、边用于表示两端物理算子之间的关系,素材图Gfinal中具有相同算子属性的两个物理算子之间的边为双向边,算子属性包括表及表属性;将素材图Gfinal中的顶点变量化,得到因果概率图Gprob;利用因果概率图Gprob对给定的新查询进行因果式基数估计。

Patent Agency Ranking