基于高质量上下文样本和自修正的大语言模型SQL生成方法

    公开(公告)号:CN118568127A

    公开(公告)日:2024-08-30

    申请号:CN202410624524.1

    申请日:2024-05-20

    Abstract: 本发明提供一种基于高质量上下文样本和自修正的大语言模型SQL生成方法,包括:利用大语言模型分别对待生成SQL的自然语言查询语句和上下文样本集进行实体链接提取;对大语言模型进行结构预测训练,并预测SQL语句的语法结构;检索结构和语义均相似的上下文样本,获取高质量上下文样本集;利用高质量上下文样本集引导大语言模型生成最终的SQL预测语句;最后进行SQL执行检测、语法语义分析和引导自修正,确保SQL语句能正常执行;本发明通过检索更匹配的上下文样本作为高质量样本,能够提高上下文学习对大语言模型的指导能力,从而提高SQL生成的准确率;本发明还能提高大语言模型对SQL中潜藏的错误的识别能力和纠正能力。

Patent Agency Ranking