-
公开(公告)号:CN119003686A
公开(公告)日:2024-11-22
申请号:CN202411123283.9
申请日:2024-08-15
Applicant: 电子科技大学
IPC: G06F16/31 , G06F16/335 , G06F16/332 , G06F16/22 , G06F16/242 , G06F16/2458 , G06F16/2457
Abstract: 本发明公开一种面向时序数据模型的倒排索引结构及改进InfluxDB,涉及数据库技术领域,解决面对包含大量文本数据的复杂存储场景,时序数据库的分析效率无法达到预期的技术问题;本发明包括一级倒排索引和二级倒排索引,所述一级倒排索引与InfluxDB中原有的TSI索引位于同一层级,用于根据关键词筛选时间线,所述二级倒排索引位于InfluxDB生成的每个TSM文件内,用于维护从关键词到文本数据条目集合的映射;本发明支持时间线筛选和时间范围筛选,减小在查询过程中访问的数据规模,大幅提升了时序数据库的文本搜索能力。
-
公开(公告)号:CN120045635A
公开(公告)日:2025-05-27
申请号:CN202510110055.6
申请日:2025-01-23
Applicant: 电子科技大学
IPC: G06F16/31 , G06F16/334 , G06N3/126 , G06N3/04 , G06N3/092
Abstract: 本发明公开了一种基于多大语言模型专家引导的数据库参数调优方法,构建专家系统,使用RRAG算法处理文档构建分层索引保存摘要;基于遗传算法GA,依据自适应生存原则选个体后杂交并按概率改变元素生成高质量样本;存储遗传算法GA生成的样本,搜索空间优化器对内存池指标分类、压缩降维,获取遗传算法样本变化指标并结合专家知识形成完整旋钮列表;采用优化的DDPG算法λ‑DDPG,考虑多个因素,通过延迟更新和软更新策略提高强化学习稳定性推荐最佳配置。本方法在不显著改变现有数据库架构和基础模型的情况下,直接应用于数据库旋钮调优任务,显著提升数据库性能,尤其在应对复杂数据库环境和动态变化的工作负载时展现出良好效果。
-
公开(公告)号:CN118568200A
公开(公告)日:2024-08-30
申请号:CN202410704846.7
申请日:2024-06-03
Applicant: 电子科技大学
IPC: G06F16/33 , G06F40/186 , G06F40/289 , G06F40/30
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于提示调优的司法文本关系抽取方法。该方法使用司法文本数据集,利用预训练模型进行提示调优的方法来实现司法文本的关系抽取。通过利用大规模预训练模型的强大语言理解能力,设计了针对司法领域的提示模板,以引导模型更有效地捕捉和理解法律文本中的关键信息。此方法不仅提高了关系抽取的准确性,还显著降低了对大量标注数据的依赖。
-
公开(公告)号:CN112948398B
公开(公告)日:2023-02-24
申请号:CN202110476035.2
申请日:2021-04-29
Applicant: 电子科技大学
Abstract: 本发明公开了一种面向冷热数据的分级存储系统及方法,系统包括数据采集模块、冷热数据判定模块和冷热数据迁移模块;其中,数据采集模块用于采集用户数据访问请求;冷热数据判定模块用于分析数据访问请求同时根据分析出的温度计算相关信息计算数据温度,并将温度计算相关信息和数据温度更新并重新封装至原始数据;冷热数据迁移模块用于对热库中的数据进行监控,将不符合热库中两个设定阈值的热数据迁移到冷库中,并根据数据访问特征动态调整设定阈值。本发明基于数据的访问时间、访问频率和数据关联性三个方面的特征,对数据的温度进行量化,实现对冷热数据的判定和冷热数据的分离存储。
-
公开(公告)号:CN112988802B
公开(公告)日:2022-07-15
申请号:CN202110475590.3
申请日:2021-04-29
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/242 , G06F16/22 , G06F16/28 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本发明公开了一种基于强化学习的关系型数据库查询优化方法及系统,方法包括以下步骤:步骤1:通过树卷积神经网络提取逻辑计划树及优化器状态信息特征;步骤2:利用强化学习模型获得匹配的优化规则应用顺序;步骤3:优化器选择适合当前查询的优化规则;系统包括规则应用与信息采集模块、机器学习模块和数据交换模块;所述规则应用与信息采集模块和机器学习模块通过数据交换模块连接,通过本地RPC请求实现数据库与规则应用与信息采集模块和机器学习模块的数据交互。本发明使用强化学习让数据库能够根据当前处理的SQL查询语句自动选择每一步的逻辑优化规则,增加了逻辑优化的可扩展性,提高了逻辑优化阶段的灵活性,进而提高数据查新效率。
-
公开(公告)号:CN119025554A
公开(公告)日:2024-11-26
申请号:CN202411154225.2
申请日:2024-08-22
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/2455 , G06N3/0442 , G06N3/084 , G06F16/242
Abstract: 本发明属于数据库查询优化任务领域,涉及一种跨数据库通用化下的不确定性量化查询代价估计方法。可以量化成本估算的不确定性,并准确有效地推广到未曾学习过的数据库。主要分为跨数据库表示模块CDR和不确定性成本估计模块CEU。CDR模块对跨数据库查询计划特征的最小集进行编码,同时使用Tree‑LSTM忽略特定于数据库的特征。随后CEU模块对数据库中给定的一组查询计划进行代价估计并输出估计的不确定度。该方法相比于传统的代价估计,可以量化成本估算的不确定性,并准确有效地推广到未曾学习过的数据库。
-
公开(公告)号:CN117113075A
公开(公告)日:2023-11-24
申请号:CN202310810875.7
申请日:2023-07-04
Applicant: 电子科技大学
IPC: G06F18/214 , G06F18/213 , G06N3/042 , G06N3/08 , G06F16/2453 , G06F16/242
Abstract: 本发明公开了基于图注意力网络的查询优化领域代价估计方法,包括以下步骤:获取数据并构建针对PostgreSQL数据库的训练集;构建代价估计模型的深度学习网络;将训练集传入代价估计模型对深度学习网络进行训练;基于需要预测的查询语句的数据,得到预测的代价;将代价估计模型外挂于PostgreSQL数据库中,实现在该数据库上的代价估计任务。本发明对传统的基数估计和代价估计方法的发展进行了调研,深入研究和分析了现有的学习型代价估计模型存在的问题,并提出了基于图注意力网络的代价估计模型。在特征编码中引入表格基数、基表选择率和连接选择率等有效的特征数据,从而提高了代价估计的准确性。
-
公开(公告)号:CN113010547A
公开(公告)日:2021-06-22
申请号:CN202110491751.8
申请日:2021-05-06
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/2455 , G06F16/22 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图神经网络的数据库查询优化方法及系统,方法包括:数据采集:根据数据的使用规律来合理的调节采样行为;基数及代价估计:利用树型图神经网络提取查询计划树的结构特征,并使用图卷积网络提取各个数据列的关联关系及连接的拓扑关系,从而建立基数及代价估计网络模型;连接顺序优化:利用图卷积算法提取查询特征和连接顺序特征,并利用强化学习算法感知数据库真实环境,从而不断优化模型,从而提升连接顺序决策的效果;通过对数据分布特征、关联关系和数据库环境特点的学习,建立基数估计模型和连接顺序优化模型,并将算法融合到分布式关系型数据库中。本发明提高在逻辑优化和物理优化阶段的算法效率,提升了查询执行速度。
-
公开(公告)号:CN112988802A
公开(公告)日:2021-06-18
申请号:CN202110475590.3
申请日:2021-04-29
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/242 , G06F16/22 , G06F16/28 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本发明公开了一种基于强化学习的关系型数据库查询优化方法及系统,方法包括以下步骤:步骤1:通过树卷积神经网络提取逻辑计划树及优化器状态信息特征;步骤2:利用强化学习模型获得匹配的优化规则应用顺序;步骤3:优化器选择适合当前查询的优化规则;系统包括规则应用与信息采集模块、机器学习模块和数据交换模块;所述规则应用与信息采集模块和机器学习模块通过数据交换模块连接,通过本地RPC请求实现数据库与规则应用与信息采集模块和机器学习模块的数据交互。本发明使用强化学习让数据库能够根据当前处理的SQL查询语句自动选择每一步的逻辑优化规则,增加了逻辑优化的可扩展性,提高了逻辑优化阶段的灵活性,进而提高数据查新效率。
-
公开(公告)号:CN118964403A
公开(公告)日:2024-11-15
申请号:CN202410991235.5
申请日:2024-07-23
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/28 , G06F18/23213 , G06F18/214
Abstract: 本发明属于数据库管理系统查询优化技术领域,具体涉及一种基于注意力机制和数据感知的基数估计优化方法。本发明提出了一种数据感知的双注意力模型,集成了位置注意力模块和交叉注意力模块,然后采用了基于贝叶斯神经网络的学习能力策略,通过蒙特卡洛dropout方法对模型不确定性进行量化,有效提升了模型对多样化数据分布的适应性和泛化能力,最后设计了主动学习数据采样策略,能够智能筛选出对模型训练最为关键的数据样本,优化学习过程,提高预测的准确性,通过集成学习策略,融合了通过不同数据采样策略获得的多个模型,构建了一个强大的集成模型,进一步提升了模型在多种查询工作负载下的泛化能力和稳定性。
-
-
-
-
-
-
-
-
-