-
公开(公告)号:CN115841016A
公开(公告)日:2023-03-24
申请号:CN202211275449.X
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F30/20 , G06F119/02
Abstract: 本说明书实施例公开了一种基于特征选择的模型训练方法、装置以及设备。通过获取所述M个任务的共享特征Z;针对第k个任务,根据所述共享特征Z确定特征对于任务的权重向量,根据所述共享特征和所述权重向量确定第k个任务的第一预测结果;针对第i个特征,将所述共享特征Z中的第i行替换为预设值,生成修改后的共享特征,根据所述修改后的共享特征确定第k个任务的第二预测结果;根据所述第一预测结果和所述第二预测结果的差异确定第i个特征对于第k个任务的因果效应因子;确定所述因果效应因子和所述权重向量的差异,根据所述差异生成损失值对所述多任务模型进行训练,从而实现在训练过程中为每个任务选择性地学习具有因果关系的特征。
-
-
公开(公告)号:CN111401963B
公开(公告)日:2022-06-07
申请号:CN202010202058.X
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种训练用户行为预测模型的方法和装置,方法包括:获取多个训练样本,训练样本包括样本特征、第一标签、第二标签和第三标签,第一标签对应主任务,第二标签对应第一辅助任务,第三标签对应第二辅助任务;将各样本特征输入用户行为预测模型,基于主任务的预测输出和第一标签,第一辅助任务的预测输出和第二标签,第二辅助任务的预测输出和第三标签,采用多任务学习的方式训练用户行为预测模型;其中,主任务用于预测用户点击目标对象后发生预设行为的概率,第一辅助任务用于预测用户点击目标对象的概率,第二辅助任务用于预测用户点击目标对象并发生预设行为的概率。训练后的模型预测准确率高。
-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。
-
公开(公告)号:CN119538984A
公开(公告)日:2025-02-28
申请号:CN202411659120.2
申请日:2024-11-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895
Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。
-
公开(公告)号:CN117932164A
公开(公告)日:2024-04-26
申请号:CN202410139688.5
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/2457 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供的推荐方法、推荐模型的模型训练方法及设备,对历史行为序列中交互项的项标识与辅助信息进行融合;基于项标识信息、融合信息以及位置信息,通过位置解耦的融合自注意力模型确定各个交互项的融合项标识表征;基于各个交互项的融合项标识表征与候选项之间的匹配得分向用户推荐候选项。根据本说明书实施例的技术方案,能够消除位置信息与项标识、辅助信息之间的噪声干扰,并保留了项标识与辅助信息之间的强相关性,从而能够提高个性化推荐的准确性。
-
-
公开(公告)号:CN116128581A
公开(公告)日:2023-05-16
申请号:CN202211261153.2
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/06 , G06V10/74 , G06V10/10 , G06V10/762
Abstract: 本说明书提供的物品推荐方法和系统,在获取目标物品的属性信息和用户交互信息后,在属性信息中提取出相似性特征,得到显式相似性特征,并基于用户交互信息,确定与目标物品相似的至少一个物品,以得到隐式相似性特征,以及基于显式相似性特征和隐式相似性特征,确定目标物品对应的推荐模型的初始化参数,并基于初始化参数,采用推荐模型对目标物品进行推荐;该方案可以提升在冷启动下物品推荐的准确率。
-
公开(公告)号:CN115496162A
公开(公告)日:2022-12-20
申请号:CN202211259139.9
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型的训练方法、装置以及设备。通过获取第j层对于训练样本的输出特征xj,生成由M个输出特征所组成的特征矩阵,1≤j≤M;针对第i个任务,根据稀疏矩阵中的第i行与所述输出特征矩阵生成对应该任务的稀疏特征vi,其中,所述稀疏矩阵中包含K*M个可训练的稀疏参数Z;获取所述多任务模型对所述第i个任务的初始预测特征,融合所述初始预测特征和所述稀疏特征vi生成第i个任务的目标预测特征yi;根据所述目标预测特征yi和训练样本的标签的差异确定第i个任务的损失值Li;融合所产生的K个任务的损失值生成总损失值,根据所述总损失值对所述稀疏参数Z进行训练。
-
公开(公告)号:CN113420879A
公开(公告)日:2021-09-21
申请号:CN202110782136.2
申请日:2021-07-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种多任务学习模型的预测方法及装置,所述方法包括:利用掩码对嵌入向量进行加权,得到加权后的嵌入向量;将加权后的嵌入向量输入第一子网络层和第三子网络层,得到第一子网络层的第一输出向量和第三子网络层的第二输出向量;将第一输出向量和第二输出向量输入第二子网络层进行处理,得到第三输出向量,处理包括利用第二子网络层的中的第一编码变量对第一输出向量进行计算,利用第二子网络层的中的第二编码变量对第二输出向量进行计算,其中第一编码变量指示第一子网络层中神经元与第三子网络层中神经元之间的连接关系,第二编码变量指示第二子网络层中神经元与第三子网络层中神经元之间的连接关系。
-
-
-
-
-
-
-
-
-