-
公开(公告)号:CN117057430B
公开(公告)日:2024-01-09
申请号:CN202311289797.7
申请日:2023-10-08
Applicant: 清华大学
IPC: G06N5/04 , G06F16/23 , G06F16/907
Abstract: 本发明涉及人工智能领域,提供一种基于规则累积的模型推理方法、装置及电子设备,其中的方法包括:获取目标任务对应的模型推理结果;获取对模型推理结果的用户端反馈,用户端反馈包括模型推理结果对应的推理标签,以及目标任务对应的正确答案;基于用户端反馈,在预设规则库中检索目标任务对应的推理规则;根据推理规则,推理得到目标任务的正确推理结果。该方法通过额外提供规则引导,在无需微调的情况下,引导大语言模型逐渐适应当前场景的特定需求,实现了轻量级的模型优化,克服了现有模型推理方法需要耗费巨大时间/资源成本,且推理结果准确度不高的缺陷,提升了模型推理结果的准确度。
-
公开(公告)号:CN117057430A
公开(公告)日:2023-11-14
申请号:CN202311289797.7
申请日:2023-10-08
Applicant: 清华大学
IPC: G06N5/04 , G06F16/23 , G06F16/907
Abstract: 本发明涉及人工智能领域,提供一种基于规则累积的模型推理方法、装置及电子设备,其中的方法包括:获取目标任务对应的模型推理结果;获取对模型推理结果的用户端反馈,用户端反馈包括模型推理结果对应的推理标签,以及目标任务对应的正确答案;基于用户端反馈,在预设规则库中检索目标任务对应的推理规则;根据推理规则,推理得到目标任务的正确推理结果。该方法通过额外提供规则引导,在无需微调的情况下,引导大语言模型逐渐适应当前场景的特定需求,实现了轻量级的模型优化,克服了现有模型推理方法需要耗费巨大时间/资源成本,且推理结果准确度不高的缺陷,提升了模型推理结果的准确度。
-