-
公开(公告)号:CN119990321A
公开(公告)日:2025-05-13
申请号:CN202510120065.8
申请日:2025-01-25
Applicant: 浙江大学计算机创新技术研究院
IPC: G06N5/04 , G06N20/00 , G06N3/09 , G06N3/092 , G06F18/214 , G06F8/30 , G06F11/3604 , G06F16/2452
Abstract: 本发明公开了一种针对表格问答大模型的训练方法及系统。表格问答任务是指根据提供的表格数据例如csv文件,excel文件,数据库db数据等表格形式数据,针对表格数据提出数据查询,数据统计分析,可视化等表格相关的问题,通过Python或SQL代码能够执行得到答案的问答任务。本发明结合表格问答领域的特点提出了一种针对表格问答任务的大语言模型增强训练方法,在已有的大语言模型基础上,通过构建表格问答任务相关的专门数据集,设计结合表格问答的符合奖励反馈系统,结合镜像模型的强化学习训练策略,增强大语言模型在表格数据问答上的能力。