开放域Text-to-SQL的多跳表格检索方法、系统、存储介质及设备

    公开(公告)号:CN119719146A

    公开(公告)日:2025-03-28

    申请号:CN202411762024.0

    申请日:2024-12-03

    Abstract: 开放域Text‑to‑SQL的多跳表格检索方法、系统、存储介质及设备,属于Text‑to‑SQL技术领域。为了解决现有的表格检索方法存在因实体和很多不相关表格中实体相似导致的不相关表格被检索到的问题,以及实体可能和相关领域不匹配导致的检索到的表格更加远离相关领域的问题。本发明采用多跳检索,第一跳采用原始的用户问题检索表格,而在之后的跳步中,采用LLM改写的表格化的问题检索表格;并且采用束搜索在每一跳保持多个检索结果,通过每一跳检索阶段结束后计算表格与问题相关的概率,选取多组最有可能的检索结果,和原始的用户问题一起输入给改写阶段;对所有表格进行排序,并据此选取表格进行检索。

Patent Agency Ranking