-
公开(公告)号:CN118350414A
公开(公告)日:2024-07-16
申请号:CN202410358176.8
申请日:2024-03-27
Applicant: 厦门大学
IPC: G06N3/0455 , G06N3/09 , G06N3/082
Abstract: 本发明公开了一种两阶段微调大语言模型代理的方法,涉及人工智能技术领域。本发明的方法先对大型语言模型执行标准的有监督微调,以减少大语言模型的输出和代理API之间的误差;然后将第一阶段微调后的大语言模型,使用数据集中的用户指令进行多个API输出的采样,并进行实际调用以及用已有的评分模型进行评分,将大语言模型输出的分数高的API的输出概率对齐,并减少低分API的输出概率。通过采用两阶段的微调大语言模型产生代理,不仅可以使得大语言模型能对用户的指令响应代理API,并且大语言模型更加与人类偏好进行对齐,使得用户可以在特定任务中获得相应的适合用户输入指令的API调用。