-
公开(公告)号:CN119719146A
公开(公告)日:2025-03-28
申请号:CN202411762024.0
申请日:2024-12-03
Applicant: 哈尔滨工业大学
IPC: G06F16/2452 , G06F16/2453 , G06F16/2455 , G06N5/04
Abstract: 开放域Text‑to‑SQL的多跳表格检索方法、系统、存储介质及设备,属于Text‑to‑SQL技术领域。为了解决现有的表格检索方法存在因实体和很多不相关表格中实体相似导致的不相关表格被检索到的问题,以及实体可能和相关领域不匹配导致的检索到的表格更加远离相关领域的问题。本发明采用多跳检索,第一跳采用原始的用户问题检索表格,而在之后的跳步中,采用LLM改写的表格化的问题检索表格;并且采用束搜索在每一跳保持多个检索结果,通过每一跳检索阶段结束后计算表格与问题相关的概率,选取多组最有可能的检索结果,和原始的用户问题一起输入给改写阶段;对所有表格进行排序,并据此选取表格进行检索。
-
公开(公告)号:CN116521711A
公开(公告)日:2023-08-01
申请号:CN202310502292.8
申请日:2023-05-06
Applicant: 哈尔滨工业大学 , 中国电力科学研究院有限公司 , 国网天津市电力公司 , 国家电网有限公司
IPC: G06F16/242 , G06F8/41 , G06N20/00
Abstract: 一种Text‑to‑SQL方法、系统及介质,涉及数据库技术领域,针对现有技术中长度较长的问题以及数据库结构,生成SQL时存在准确率低的问题,本申请针对长度较长的问题以及数据库结构中存在的模型记忆信息困难以及信息对应能力较弱,本申请通过信息标记以及应用SQL语法规则解决了记忆信息困难以及信息对应能力较弱的问题,进而解决了现有技术中长度较长的问题以及数据库结构,生成SQL时存在准确率低的问题,提升了SQL生成的准确率。
-