-
公开(公告)号:CN117034040A
公开(公告)日:2023-11-10
申请号:CN202311235524.4
申请日:2023-09-25
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于关系感知与增量学习的数据库模式匹配方法,属于计算机数据库技术领域。首先发现目标数据库与源数据库各自的模态信息。然后将子模态文本信息进行特征提取。之后将特征提取信息输入贝叶斯网络进行选择筛选。该过程中,同样进行特征的质量度量,保证子模态分类的准确性和稳定性。同时,引入神经元正则化与贝叶斯增量学习方法,充分发掘模型的持续学习能力。最后,将得到的目标数据库子模态与源数据库子模态通过特征关系感知模态,得到模式匹配结果。本发明能够有效提升不同数据库之间的查询和模式匹配处理效率和准确率。
-
公开(公告)号:CN117194502A
公开(公告)日:2023-12-08
申请号:CN202311444981.4
申请日:2023-11-02
Applicant: 北京理工大学
IPC: G06F16/2455 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及一种基于长短期记忆网络的数据库内容缓存替换方法,属于计算机数据库技术领域。本方法使用长短期记忆网络预测缓存替换最优解,按照先主后次、先急后缓的策略进行缓存队列更新,降低神经网络预测不确定性对整体性能的影响。通过对算法逻辑的优化,不直接将长短期记忆网络的预测结果作为最终的替换结果,而是将其视为缓存替换的重要参考项,结合当前缓存队列中现有的缓存行,决定缓存数据块的去留。本发明包括训练数据集的获取、替换缓存的具体逻辑与方式,能够灵活适应不同用户的行为模式,保证了数据访问请求指令频繁时缓存替换算法性能的下限,使计算资源的调动更加灵活,互不干扰,缓存替换过程简洁高效。
-
公开(公告)号:CN116910086B
公开(公告)日:2023-12-01
申请号:CN202311179624.X
申请日:2023-09-13
Applicant: 北京理工大学
IPC: G06F16/242 , G06F16/2452 , G06F40/237 , G06F40/284 , G06F40/30 , G06F40/211 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于自注意力句法感知的数据库查询方法,属于计算机数据库技术领域。本发明对现有的分词系统进行了二次开发。为了给查询语句中的每个词语标注关系数据的语义信息,实现语义覆盖,采用统计与字典相结合的N‑最短路分词技术,依据知识库的优先级为有向无环图中的边赋予权重,以优化切分结果并更好地转换为数据库查询语句,引入隐马尔科夫模型对切分结果进行词性标注,充分利用词语信息和数据语义标签,建立词语与数据库对象之间的关联,输出一个具有数据语义的标准化词语序列。本发明能够有效提高转换模型将自然语言映射为高维语义的能力,提高数据库自然语言查询的精确度和通用能力,为用户提供更准确、更智能的查询体验。
-
公开(公告)号:CN117194502B
公开(公告)日:2024-01-23
申请号:CN202311444981.4
申请日:2023-11-02
Applicant: 北京理工大学
IPC: G06F16/2455 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及一种基于长短期记忆网络的数据库内容缓存替换方法,属于计算机数据库技术领域。本方法使用长短期记忆网络预测缓存替换最优解,按照先主后次、先急后缓的策略进行缓存队列更新,降低神经网络预测不确定性对整体性能的影响。通过对算法逻辑的优化,不直接将长短期记忆网络的预测结果作为最终的替换结果,而是将其视为缓存替换的重要参考项,结合当前缓存队列中现有的缓存行,决定缓存数据块的去留。本发明包括训练数据集的获取、替换缓存的具体逻辑与方式,能够灵活适应不同用户的行为模式,保证了数据访问请求指令频繁时缓存替换算法性能的下限,使计算资源的调动更加灵活,互不干扰,缓存替换过程简洁高效。
-
公开(公告)号:CN117349311A
公开(公告)日:2024-01-05
申请号:CN202311336112.X
申请日:2023-10-16
Applicant: 北京理工大学
IPC: G06F16/242 , G06F16/25 , G06F16/28 , G06F18/27 , G06F18/241 , G06N3/044 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于改进RetNet的数据库自然语言查询方法,属于计算机数据库技术领域。本发明利用分割查询语句后每个子语句间的关联,将NL2SQL任务分割成填充槽值的若干子任务。根据槽值填充任务的特征,将其划分为两个子问题,极大减少了NL2SOL问题的工作量;使用改进的RetNet作为自然语言处理深度模型,将深度特征序列表示为一维向量,实现自注意力机制的类RNN并行循环更新,将计算复杂度降低。通过引入多尺度残差融合机制,有效提高了不同深度语义特征的融合。本方法能够有效提高SQL语句的生成准确率,有效提升数据库的运行效率。
-
公开(公告)号:CN116910086A
公开(公告)日:2023-10-20
申请号:CN202311179624.X
申请日:2023-09-13
Applicant: 北京理工大学
IPC: G06F16/242 , G06F16/2452 , G06F40/237 , G06F40/284 , G06F40/30 , G06F40/211 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于自注意力句法感知的数据库查询方法,属于计算机数据库技术领域。本发明对现有的分词系统进行了二次开发。为了给查询语句中的每个词语标注关系数据的语义信息,实现语义覆盖,采用统计与字典相结合的N‑最短路分词技术,依据知识库的优先级为有向无环图中的边赋予权重,以优化切分结果并更好地转换为数据库查询语句,引入隐马尔科夫模型对切分结果进行词性标注,充分利用词语信息和数据语义标签,建立词语与数据库对象之间的关联,输出一个具有数据语义的标准化词语序列。本发明能够有效提高转换模型将自然语言映射为高维语义的能力,提高数据库自然语言查询的精确度和通用能力,为用户提供更准确、更智能的查询体验。
-
-
-
-
-