-
公开(公告)号:CN117216071A
公开(公告)日:2023-12-12
申请号:CN202311086604.8
申请日:2023-08-28
Applicant: 北京遥感设备研究所
IPC: G06F16/23 , G06F16/2453 , G06F16/901
Abstract: 本发明公开了一种基于图嵌入的事务调度优化方法。涉及数据库事务调度的技术领域,该基于图嵌入的事务调度优化方法包括:基于收集的事务信息构建异构图,异构图以事务为顶点并以事务之间的关系为边;采用图嵌入模型学习异构图,以将异构图中的事务特征映射到低维特征空间中,得到事务信息对应的图嵌入表征结果,其中,图嵌入表征结果包括异构图中每个顶点经过多层迭代学习顶点特征、连接的边特征以及顶点之间边的种类的嵌入表征;建立马尔可夫决策过程模型,并采用深度强化学习对图嵌入表征结果进行迭代训练,直至达到预设迭代次数以获取输出的事务调度分配策略。本发明解决了现有事务调度无法获取全局最优调度的技术问题。
-
公开(公告)号:CN116775315A
公开(公告)日:2023-09-19
申请号:CN202311056907.5
申请日:2023-08-22
Applicant: 北京遥感设备研究所
IPC: G06F9/50 , G06F16/901
Abstract: 一种基于依赖图的多核CPU并发事务分配方法,该方法包括:基于数据库中事务之间的执行关联性构建依赖图,基于所述依赖图相邻两节点之间的依赖关系确定所述相邻两节点对应的边的信息素量;基于所述依赖图各个节点对应事务的事务属性确定各个节点的启发式信息;基于蚁群的行为模型按照所述依赖图执行所述数据库中的事务,并更新所述依赖图上各个边上的信息素。本方法基于所定义的各事务之间的关系构建依赖图并利用具有分布式特性的蚁群算法解决数据库中多核CPU并发事务调度分配问题,其在处理多个事务之间复杂的依赖关系和交织情况上具有更好的性能,充分发挥多核CPU的优势,提高了数据库系统的资源利用率和数据的执行效率。
-
公开(公告)号:CN116755847A
公开(公告)日:2023-09-15
申请号:CN202311037214.1
申请日:2023-08-17
Applicant: 北京遥感设备研究所
IPC: G06F9/46 , G06F9/48 , G06F9/52 , G06F17/18 , G06F18/213 , G06F18/23213 , G06F18/22 , G06N7/01 , G06F16/21
Abstract: 一种缓解锁冲突的日志预分析及事务管理方法,包括:基于离线事务日志对事务进行逻辑分析,确定数据库中所有事务的事务构建预测模型;基于事务执行时所需调动数据的热度统计信息确定热数据信息,所述热数据信息为数据库调用频率达到预设阈值的数据的信息;基于所述热数据信息和所述事务构建预测模型,确定当前事务数据锁的调度策略。通过构建基于马尔可夫模型的预测图来预测后续操作将访问的数据元组。然后,使用这些图信息结合图论的最短路径、拓扑排序、关键路径等算法并结合使用的事务调度策略来判断是否需要延迟事务以获取锁来调度事务,从而避免大量锁冲突带来的性能损耗。
-
公开(公告)号:CN116821436A
公开(公告)日:2023-09-29
申请号:CN202311072853.1
申请日:2023-08-24
Applicant: 北京遥感设备研究所
IPC: G06F16/903 , G06N3/08
Abstract: 一种面向模糊查询的字符串谓词准确选择估计方法,将获取的查询语句和数据库中的语料库作为自回归神经语言模型架构的输入,训练所述自回归神经语言模型。将实际查询语句中谓词的单个字符依次作为当前时间步的输入,结合先前时间步的隐藏状态确定当前时间步的隐藏状态。基于所述实际查询语句中各个谓词的下一个字符的概率分布,确定所述各个谓词的选择性评估概率。以往神经语言模型主要用于自然语言处理。本方法认为传统方法为简易语言模型,提出使用NLM应用于数据库字符串谓词选择性估计,NLM可以不需要构建字典和统计信息即进行估计,为数据库字符串谓词选择性估计任务开辟了新的高效解决途径。
-
公开(公告)号:CN116775666A
公开(公告)日:2023-09-19
申请号:CN202311072852.7
申请日:2023-08-24
Applicant: 北京遥感设备研究所
IPC: G06F16/22 , G06F16/23 , G06F16/242
Abstract: 一种数据索引在线自动调优的方法,包括:基于索引选择的流程建立多臂老虎机模型,所述多臂老虎机模型中的每个臂代表从查询语句到查询结果的查询数据流程;基于当前工作负载生成新的索引臂,并将所述新的索引臂加入原索引臂集中,形成新的索引臂集;通过所述多臂老虎机模型中的贪心预测模型,确定所述新的索引臂集中的执行超级臂,所述执行超级臂用于执行所述当前工作负载的数据库查询工作。将索引优化问题建模为老虎机的序贯决策问题,每个可能的索引配置表示为一个臂,随后根据查询特征动态生成相关索引作为臂,缩小了搜索空间,降低了学习复杂度。这种不依赖于不准确的成本估计模型的方法,能够使学习到的知识更贴近实际效果。
-
公开(公告)号:CN116775315B
公开(公告)日:2024-01-02
申请号:CN202311056907.5
申请日:2023-08-22
Applicant: 北京遥感设备研究所
IPC: G06F9/50 , G06F16/901
Abstract: 一种基于依赖图的多核CPU并发事务分配方法,该方法包括:基于数据库中事务之间的执行关联性构建依赖图,基于所述依赖图相邻两节点之间的依赖关系确定所述相邻两节点对应的边的信息素量;基于所述依赖图各个节点对应事务的事务属性确定各个节点的启发式信息;基于蚁群的行为模型按照所述依赖图执行所述数据库中的事务,并更新所述依赖图上各个边上的信息素。本方法基于所定义的各事务之间的关系构建依赖图并利用具有分布式特性的蚁群算法解决数据库中多核CPU并发事务调度分配问题,其在处理多个事务之间复杂的依赖关系和交织情况上具有更好的性能,充分发挥多核CPU的优势,提高了数据库系统的资源利用率和数据的执行效率。
-
公开(公告)号:CN116775666B
公开(公告)日:2023-11-14
申请号:CN202311072852.7
申请日:2023-08-24
Applicant: 北京遥感设备研究所
IPC: G06F16/22 , G06F16/23 , G06F16/242
Abstract: 一种数据索引在线自动调优的方法,包括:基于索引选择的流程建立多臂老虎机模型,所述多臂老虎机模型中的每个臂代表从查询语句到查询结果的查询数据流程;基于当前工作负载生成新的索引臂,并将所述新的索引臂加入原索引臂集中,形成新的索引臂集;通过所述多臂老虎机模型中的贪心预测模型,确定所述新的索引臂集中的执行超级臂,所述执行超级臂用于执行所述当前工作负载的数据库查询工作。将索引优化问题建模为老虎机的序贯决策问题,每个可能的索引配置表示为一个臂,随后根据查询特征动态生成相关索引作为臂,缩小了搜索空间,降低了学习复杂度。这种不依赖于不准确的成本估计模型的方法,能够使学习到的知识更贴近实际效果。
-
公开(公告)号:CN116804972A
公开(公告)日:2023-09-26
申请号:CN202311062451.3
申请日:2023-08-23
Applicant: 北京遥感设备研究所
Abstract: 本发明公开了一种数据库基准测试用例动态生成方法,包括:确定数据库的基准测试需求以及基准测试数据;将基准测试数据按照基准测试需求拆分出所涉及的操作对象和操作;其中,操作对象为测试过程中所涉及的数据表集合、字段集合以及相应的时间范围,拆分出的操作指基准测试需求中的测试指标对应到数据库可执行的操作集合;使用系统抽样模型抽取所述操作对象,得到抽样结果;使用操作重组模型将基准测试需求的编码结果映射到数据库的接口空间中,并且使用ARIMA模型预测基准测试需求中的时间段所对应的数据库操作,得到重组后的操作;将抽样结果和重组后的操作输入到用例形式化描述模型中,生成测试用例集合。在基础测试的基础上进行微调以提高测试用例的真实性和代表性。
-
公开(公告)号:CN116775565A
公开(公告)日:2023-09-19
申请号:CN202311041878.5
申请日:2023-08-18
Applicant: 北京遥感设备研究所
IPC: G06F16/11 , G06F16/172
Abstract: 本发明公开了一种高性能存储引擎的快照隔离管理方法。涉及数据库并发控制的技术领域,该高性能存储引擎的快照隔离管理方法包括:在数据库的一个线程运行当前事务时,基于当前事务的开始时间戳与各个快照版本的提交时间戳的比对结果,确定各个快照版本对于当前事务的可见性;为持续时长超过预设阈值的长时间事务添加失活标签索引,以确定快照版本是否携带有删除标记;使用行外存储方式存储快照版本,并在达到存储转换条件的情况下,将存储方式调整为行内存储。本发明解决了数据库处理并发事务效率较低的技术问题。
-
公开(公告)号:CN116804972B
公开(公告)日:2023-11-14
申请号:CN202311062451.3
申请日:2023-08-23
Applicant: 北京遥感设备研究所
Abstract: 本发明公开了一种数据库基准测试用例动态生成方法,包括:确定数据库的基准测试需求以及基准测试数据;将基准测试数据按照基准测试需求拆分出所涉及的操作对象和操作;其中,操作对象为测试过程中所涉及的数据表集合、字段集合以及相应的时间范围,拆分出的操作指基准测试需求中的测试指标对应到数据库可执行的操作集合;使用系统抽样模型抽取所述操作对象,得到抽样结果;使用操作重组模型将基准测试需求的编码结果映射到数据库的接口空间中,并且使用ARIMA模型预测基准测试需求中的时间段所对应的数据库操作,得到重组后的操作;将抽样结果和重组后的操作输入到用例形式化描述模型中,生成测试用例集合。在基础测试的基础上进行微调以提高测试用例的真实性和代表性。
-
-
-
-
-
-
-
-
-