-
公开(公告)号:CN116932570A
公开(公告)日:2023-10-24
申请号:CN202310749648.8
申请日:2023-06-21
Applicant: 复旦大学
IPC: G06F16/242 , G06F16/23 , G06F16/2455
Abstract: 本申请涉及信息技术领域,公开了基于自然语言生成结构化查询语言的方法和装置,该方法包括:将接收到的自然语言语句转换为初始结构化查询语言语句,并获取中间状态信息;基于中间状态信息,检测出组成初始结构化查询语言语句的多个查询单元中的一个或多个错误查询单元;将一个或多个错误查询单元分类成一个或多个错误类别;根据错误类别,为错误类别中的每个错误查询单元生成一个或多个候选项,并根据每个错误查询单元以及对应的一个或多个候选项,生成自然语言交互语句;接收用户基于自然语言交互语句输入的反馈,并基于反馈对每个错误查询单元进行修改和存储。本发明避免了模型在转换的过程中出现重复的错误,提高了模型的转换准确度。
-
公开(公告)号:CN117331835A
公开(公告)日:2024-01-02
申请号:CN202311322798.7
申请日:2023-10-12
Applicant: 复旦大学
IPC: G06F11/36 , G06F16/2452
Abstract: 本发明涉及数据集的处理方法,包括:接收多个第一SQL语句‑自然语言对;对于每个所述第一SQL语句‑自然语言对,将其中的第一SQL语句切分为SQL语句单元,将其中的第一自然语言切分为自然语言单元,并将所述SQL语句单元和所述自然语言单元对齐;将多个所述SQL语句单元和对齐的所述自然语言单元组合为多个第二SQL语句‑自然语言对;将多个所述第二SQL语句‑自然语言对分为训练集和测试集。本发明还涉及SQL‑自然语言翻译模型的测试的方法、数据集的处理和SQL‑自然语言翻译模型的测试装置,以及计算设备集群、计算机程序产品和介质。
-