-
公开(公告)号:CN119599080A
公开(公告)日:2025-03-11
申请号:CN202411756260.1
申请日:2024-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0895 , G06N3/0475 , G06N3/0455 , G06F40/30 , G06F16/9535 , G06F16/9538 , G06Q30/0251 , G06Q30/0241
Abstract: 本说明书一个或多个实施例提供了一种生成式检索模型的训练方法、信息检索方法及装置。该训练方法采用两阶段训练策略。其中,第一阶段可以称为文档标识符生成阶段,该阶段利用一一对应的第一查询词条和第一标准文档标识符,训练待训练生成式检索模型学习查询与文档标识符之间的关系。第二阶段可以称为文档排名阶段,该阶段通过对比学习方法,利用一一对应的第二查询词条、第二正样本文档和负样本文档,训练第一阶段训练后的模型学习查询与文档之间的关系。
-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。
-
公开(公告)号:CN119538984A
公开(公告)日:2025-02-28
申请号:CN202411659120.2
申请日:2024-11-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895
Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。
-
-