-
公开(公告)号:CN114880347A
公开(公告)日:2022-08-09
申请号:CN202210456388.0
申请日:2022-04-27
Applicant: 北京理工大学
IPC: G06F16/2452 , G06F16/22 , G06F16/2455 , G06F40/30 , G06F40/253 , G06N5/02 , G06N20/00
Abstract: 本发明涉及到一种基于深度学习的自然语言转化为SQL语句的方法,特别是使用知识蒸馏方法的获得轻量级的模型技术,属于数据库智能检索、问答系统等技术领域。本发明提出了一种基于深度学习的NL2SQL算法,基于BERT预训练模型对英文和中文的自然语言进行编码训练得到NL2SQL模型,再使用知识蒸馏方法获得轻量级的NL2SQL模型,根据提供的NL2SQL任务数据集训练模型,输入自然语言问题后即可推理出对应的SQL语句;本发明能够处理中文和英文NL2SQL任务;本发明减小模型的计算资源消耗,提高推理速度。