-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。