-
公开(公告)号:CN120045635A
公开(公告)日:2025-05-27
申请号:CN202510110055.6
申请日:2025-01-23
Applicant: 电子科技大学
IPC: G06F16/31 , G06F16/334 , G06N3/126 , G06N3/04 , G06N3/092
Abstract: 本发明公开了一种基于多大语言模型专家引导的数据库参数调优方法,构建专家系统,使用RRAG算法处理文档构建分层索引保存摘要;基于遗传算法GA,依据自适应生存原则选个体后杂交并按概率改变元素生成高质量样本;存储遗传算法GA生成的样本,搜索空间优化器对内存池指标分类、压缩降维,获取遗传算法样本变化指标并结合专家知识形成完整旋钮列表;采用优化的DDPG算法λ‑DDPG,考虑多个因素,通过延迟更新和软更新策略提高强化学习稳定性推荐最佳配置。本方法在不显著改变现有数据库架构和基础模型的情况下,直接应用于数据库旋钮调优任务,显著提升数据库性能,尤其在应对复杂数据库环境和动态变化的工作负载时展现出良好效果。
-
公开(公告)号:CN113190529A
公开(公告)日:2021-07-30
申请号:CN202110474219.5
申请日:2021-04-29
Applicant: 电子科技大学
Abstract: 本发明公开了一种适用MongoDB数据库的多租户数据共享存储系统,包括客户端、服务端和网络传输模块;网络传输模块用于在客户端和服务端之间进行数据通信和数据传输;服务端用于根据处理后的数据库服务请求执行对应的数据库操作,并将请求结果返回至客户端;客户端用于提供数据的读写接口,以及将用户的数据库服务请求进行处理,通过网络连接将处理后的数据库服务请求发送至服务端,同时根据相应的数据格式和协议对服务端返回的请求结果进行解析并呈现给用户。本发明使用元数据管理和命名空间等机制相结合的方式进行实现了多租户对于数据库实例的共享,为了提供多个租户在共享使用同一个数据库实例时的数据隔离,保证了每个租户数据的完整性和安全性。
-
公开(公告)号:CN119003686A
公开(公告)日:2024-11-22
申请号:CN202411123283.9
申请日:2024-08-15
Applicant: 电子科技大学
IPC: G06F16/31 , G06F16/335 , G06F16/332 , G06F16/22 , G06F16/242 , G06F16/2458 , G06F16/2457
Abstract: 本发明公开一种面向时序数据模型的倒排索引结构及改进InfluxDB,涉及数据库技术领域,解决面对包含大量文本数据的复杂存储场景,时序数据库的分析效率无法达到预期的技术问题;本发明包括一级倒排索引和二级倒排索引,所述一级倒排索引与InfluxDB中原有的TSI索引位于同一层级,用于根据关键词筛选时间线,所述二级倒排索引位于InfluxDB生成的每个TSM文件内,用于维护从关键词到文本数据条目集合的映射;本发明支持时间线筛选和时间范围筛选,减小在查询过程中访问的数据规模,大幅提升了时序数据库的文本搜索能力。
-
公开(公告)号:CN115587591A
公开(公告)日:2023-01-10
申请号:CN202211343563.1
申请日:2022-10-31
Applicant: 电子科技大学
IPC: G06F40/289 , G06F18/24 , G06N3/04 , G06N3/08
Abstract: 本发明属于自然语言技术领域,尤其是涉及一种基于MRC的事件抽取方法。本发明主要包括:进行数据预处理,对于输入的文本首先需要进行数据预处理,数据预处理包括分词、数据格式转换、长文本截断等等。然后将处理好的数据传入到事件类型抽取模型中;事件类型抽取,事件类型抽取是中文事件抽取任务的核心步骤,事件类型抽取需要识别出事件的类型;事件元素抽取,事件元素抽取是中文事件抽取任务的另一个核心步骤,事件元素抽取需要检测出事件元素,并识别出这些事件元素的角色;最后将事件类型抽取模块和事件元素抽取模块的输出内容进行汇总,得到事件抽取的最终结果。相比于传统方法本发明的方法对事件论元抽取的准确率得到了明显提升。
-
公开(公告)号:CN119025554A
公开(公告)日:2024-11-26
申请号:CN202411154225.2
申请日:2024-08-22
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/2455 , G06N3/0442 , G06N3/084 , G06F16/242
Abstract: 本发明属于数据库查询优化任务领域,涉及一种跨数据库通用化下的不确定性量化查询代价估计方法。可以量化成本估算的不确定性,并准确有效地推广到未曾学习过的数据库。主要分为跨数据库表示模块CDR和不确定性成本估计模块CEU。CDR模块对跨数据库查询计划特征的最小集进行编码,同时使用Tree‑LSTM忽略特定于数据库的特征。随后CEU模块对数据库中给定的一组查询计划进行代价估计并输出估计的不确定度。该方法相比于传统的代价估计,可以量化成本估算的不确定性,并准确有效地推广到未曾学习过的数据库。
-
公开(公告)号:CN115618004A
公开(公告)日:2023-01-17
申请号:CN202211402592.0
申请日:2022-11-10
Applicant: 电子科技大学
Abstract: 本发明属于自然语言处理技术领域,尤其是涉及一种基于prompt的表格事实检测方法。本发明首次在表格事实检测任务上使用Prompt方法,在小样本或零样本情况下有效的提高判断效果。首先是将表格事实检测任务形式改造成和预训练表格模型一致,不需要在预训练模型的基础上做过多训练;其次是定义了一个多组的映射关系,可以方便的将prompt的预测结果转化为表格事实检测结果。
-
公开(公告)号:CN118964403A
公开(公告)日:2024-11-15
申请号:CN202410991235.5
申请日:2024-07-23
Applicant: 电子科技大学
IPC: G06F16/2453 , G06F16/28 , G06F18/23213 , G06F18/214
Abstract: 本发明属于数据库管理系统查询优化技术领域,具体涉及一种基于注意力机制和数据感知的基数估计优化方法。本发明提出了一种数据感知的双注意力模型,集成了位置注意力模块和交叉注意力模块,然后采用了基于贝叶斯神经网络的学习能力策略,通过蒙特卡洛dropout方法对模型不确定性进行量化,有效提升了模型对多样化数据分布的适应性和泛化能力,最后设计了主动学习数据采样策略,能够智能筛选出对模型训练最为关键的数据样本,优化学习过程,提高预测的准确性,通过集成学习策略,融合了通过不同数据采样策略获得的多个模型,构建了一个强大的集成模型,进一步提升了模型在多种查询工作负载下的泛化能力和稳定性。
-
公开(公告)号:CN119003176A
公开(公告)日:2024-11-22
申请号:CN202411123282.4
申请日:2024-08-15
Applicant: 电子科技大学
IPC: G06F9/50 , G06F16/2455 , G06F16/2458 , G06F16/22
Abstract: 本发明公开一种基于InfluxDB的高基数内存优化方法及改进InfluxDB,涉及数据库技术领域,解决如何通过对InfluxDB的存储与查询流程进行合理改造,降低InfluxDB在高基数场景下的内存消耗,使InfluxDB能够承受更高基数的数据负载的技术问题;本发明包括通过对InfluxDB的Compaction流程优化实现在高基数查询场景下减少必须驻留在内存中的时序数据量,并且基于时间线间数据分布的偏斜性对数据块定位流程及迭代器读取数据的流程优化延迟非必要数据块的读取与解压;本发明在保持低基数场景数据库读写性能的前提下,能大幅降低InfluxDB在高基数场景下的所需的内存资源,提高了InfluxDB稳健性。
-
公开(公告)号:CN113190529B
公开(公告)日:2023-09-19
申请号:CN202110474219.5
申请日:2021-04-29
Applicant: 电子科技大学
Abstract: 本发明公开了一种适用MongoDB数据库的多租户数据共享存储系统,包括客户端、服务端和网络传输模块;网络传输模块用于在客户端和服务端之间进行数据通信和数据传输;服务端用于根据处理后的数据库服务请求执行对应的数据库操作,并将请求结果返回至客户端;客户端用于提供数据的读写接口,以及将用户的数据库服务请求进行处理,通过网络连接将处理后的数据库服务请求发送至服务端,同时根据相应的数据格式和协议对服务端返回的请求结果进行解析并呈现给用户。本发明使用元数据管理和命名空间等机制相结合的方式进行实现了多租户对于数据库实例的共享,为了提供多个租户在共享使用同一个数据库实例时的数据隔离,保证了每个租户数据的完整性和安全性。
-
公开(公告)号:CN111242101A
公开(公告)日:2020-06-05
申请号:CN202010154587.7
申请日:2020-03-08
Applicant: 电子科技大学
Abstract: 本发明属于识别技术领域,提供了一种基于时空上下文关联的深度网络模型的行为识别方法。其主旨在于解决CNN模型中空间特征学习范围受到感知域大小的限制的问题,降低了模型对行为特征表示的损失,从而提高行为识别精准度。其主要方案为所将用户行为数据导入进行卷积映射操作,然后利用网格LSTM神经网络得到行为时空特征图TSF并导入注意力门模块进行不同时间特征权重学习,得到行为特征图并传入softmax分类器计算得到行为类别的概率分布D;对行为类别的概率分布D和训练集行为标签Y进行交叉熵损失函数运算,得到损失Loss0,并引入l2损失函数作为最后的总损失函数L;根据总损失函数L,利用反向传播操作修改模型可虚席参数的数值,得到深度网络模型M。
-
-
-
-
-
-
-
-
-