-
公开(公告)号:CN117932164A
公开(公告)日:2024-04-26
申请号:CN202410139688.5
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/2457 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供的推荐方法、推荐模型的模型训练方法及设备,对历史行为序列中交互项的项标识与辅助信息进行融合;基于项标识信息、融合信息以及位置信息,通过位置解耦的融合自注意力模型确定各个交互项的融合项标识表征;基于各个交互项的融合项标识表征与候选项之间的匹配得分向用户推荐候选项。根据本说明书实施例的技术方案,能够消除位置信息与项标识、辅助信息之间的噪声干扰,并保留了项标识与辅助信息之间的强相关性,从而能够提高个性化推荐的准确性。
-
公开(公告)号:CN111401963A
公开(公告)日:2020-07-10
申请号:CN202010202058.X
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种训练用户行为预测模型的方法和装置,方法包括:获取多个训练样本,训练样本包括样本特征、第一标签、第二标签和第三标签,第一标签对应主任务,第二标签对应第一辅助任务,第三标签对应第二辅助任务;将各样本特征输入用户行为预测模型,基于主任务的预测输出和第一标签,第一辅助任务的预测输出和第二标签,第二辅助任务的预测输出和第三标签,采用多任务学习的方式训练用户行为预测模型;其中,主任务用于预测用户点击目标对象后发生预设行为的概率,第一辅助任务用于预测用户点击目标对象的概率,第二辅助任务用于预测用户点击目标对象并发生预设行为的概率。训练后的模型预测准确率高。
-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。
-
公开(公告)号:CN119538984A
公开(公告)日:2025-02-28
申请号:CN202411659120.2
申请日:2024-11-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895
Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。
-
公开(公告)号:CN111401963B
公开(公告)日:2022-06-07
申请号:CN202010202058.X
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种训练用户行为预测模型的方法和装置,方法包括:获取多个训练样本,训练样本包括样本特征、第一标签、第二标签和第三标签,第一标签对应主任务,第二标签对应第一辅助任务,第三标签对应第二辅助任务;将各样本特征输入用户行为预测模型,基于主任务的预测输出和第一标签,第一辅助任务的预测输出和第二标签,第二辅助任务的预测输出和第三标签,采用多任务学习的方式训练用户行为预测模型;其中,主任务用于预测用户点击目标对象后发生预设行为的概率,第一辅助任务用于预测用户点击目标对象的概率,第二辅助任务用于预测用户点击目标对象并发生预设行为的概率。训练后的模型预测准确率高。
-
-
-
-