Patent search ap:("厦门大学") AND inv:"赵力锐" Page 1

1.

发明公开
一种两阶段微调大语言模型代理的方法审中-实审

公开(公告)号：CN118350414A

公开(公告)日：2024-07-16

申请号：CN202410358176.8

申请日：2024-03-27

Applicant: 厦门大学

Inventor： 纪荣嵘 , 赵力锐 , 张玉鑫

IPC: G06N3/0455 , G06N3/09 , G06N3/082

Abstract: 本发明公开了一种两阶段微调大语言模型代理的方法，涉及人工智能技术领域。本发明的方法先对大型语言模型执行标准的有监督微调，以减少大语言模型的输出和代理API之间的误差；然后将第一阶段微调后的大语言模型，使用数据集中的用户指令进行多个API输出的采样，并进行实际调用以及用已有的评分模型进行评分，将大语言模型输出的分数高的API的输出概率对齐，并减少低分API的输出概率。通过采用两阶段的微调大语言模型产生代理，不仅可以使得大语言模型能对用户的指令响应代理API，并且大语言模型更加与人类偏好进行对齐，使得用户可以在特定任务中获得相应的适合用户输入指令的API调用。

Patent Agency Ranking