-
公开(公告)号:CN118656487A
公开(公告)日:2024-09-17
申请号:CN202410705419.0
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种大型语言模型微调的方法、装置及电子设备。所述方法包括:接收针对大型语言模型的微调的任务指令,并基于所述任务指令,获取对所述大型语言模型进行微调所需的训练数据集;使用所述大型语言模型对所述训练数据集中的训练文本进行信息提取处理,得到所述训练文本对应的第一摘要;使用评估模型对所述第一摘要进行质量评估,得到所述第一摘要对应的评估结果;基于至少包含所述评估结果的微调数据对所述大型语言模型进行微调,得到微调后的大型语言模型。