-
公开(公告)号:CN118350448A
公开(公告)日:2024-07-16
申请号:CN202410568375.1
申请日:2024-05-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/096 , G06N3/094 , G06N3/0455 , G06F18/2321 , G06F18/2415 , G06F16/9535
Abstract: 本说明书实施例提供了目标模型的训练方法及装置,目标模型包括编码器和聚类网络,聚类网络中包括多个类簇的参数化的聚类原型。该方法包括:利用编码器,确定多个用户各自的编码结果,编码结果包括基于用户的原始行为序列得到的原始编码;利用聚类网络,基于各聚类原型和各原始编码确定各用户各自的聚类结果;基于各用户的编码结果与所归属的类簇的聚类原型之间的元素分布差异,确定自蒸馏损失;其中,该类簇基于聚类结果确定;基于训练损失,更新编码器的参数,训练损失包括自蒸馏损失。
-
公开(公告)号:CN118228132A
公开(公告)日:2024-06-21
申请号:CN202410308945.3
申请日:2024-03-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/213 , G06F18/22 , G06N3/02 , G06F16/9535
Abstract: 本说明书实施例提供了用于对召回模型进行训练的方法及装置。在该方法中,按照以下方式进行训练,直至满足训练结束条件:将用户数据输入兴趣特征提取网络以进行用户兴趣特征提取,得到用户兴趣表征;利用不同的神经网络分别对用户兴趣表征进行分类处理,以得到不同的用户兴趣表征组;根据不同的用户兴趣表征组中的第一用户兴趣表征组以及待分类类别物品的类别物品表征,计算用户针对类别物品偏好的第一损失;根据第一用户兴趣表征组和不同的用户兴趣表征组中的第二用户兴趣表征组、以及类别物品表征,计算第二损失;基于第一损失和第二损失得到总损失;以及根据总损失对召回模型进行调整。
-
公开(公告)号:CN118155015A
公开(公告)日:2024-06-07
申请号:CN202410301845.8
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06N3/0464 , G06N3/0475 , G06N3/08 , G06F17/18 , G06Q10/04
Abstract: 本说明书的实施例提供了一种用于提升泛化性的模型训练方法和装置。在该用于提升泛化性的模型训练方法中,利用当前预测模型根据作为当前训练样本集的各个训练样本中的特征数据得到对应的预测结果;基于各个训练样本中的标签数据和对应的预测结果之间的差异确定训练样本预测损失值;再利用当前训练样本集中的各个训练样本所属的领域对应的当前领域重加权权重对各个训练样本预测损失值进行综合,得到当前训练样本集对应的预测损失值,进而确定当前总损失值;在不满足训练结束条件的情况下根据当前总损失值对当前预测模型的参数和当前领域重加权权重进行调整。
-
公开(公告)号:CN113988291B
公开(公告)日:2024-06-04
申请号:CN202111250535.0
申请日:2021-10-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/084 , G06N3/0464 , G06N3/045 , G06Q20/38 , G06Q30/0207 , G06N3/048
Abstract: 本说明书实施例提供一种用户表征网络的训练方法,包括:将无偏样本的用户特征输入经过预训练的第一用户表征网络,得到第一用户表征向量,并且,将有偏样本的用户特征输入第二用户表征网络,得到第二用户表征向量,其中无偏样本和有偏样本分别通过向用户发放由随机策略和非随机策略确定的权益份额而采集;将得到的两个用户表征向量分别输入判别器,得到对应两个判别结果;以最小化目标函数的函数值为目标,训练判别器,该函数值与第一损失和第二损失正相关,第一损失基于无偏样本对应的判别结果和无偏标识而确定,第二损失基于有偏样本对应的判别结果和有偏标识而确定;以最大化目标函数的函数值为目标,对第二用户表征网络进行训练。
-
公开(公告)号:CN120030235A
公开(公告)日:2025-05-23
申请号:CN202510107107.4
申请日:2025-01-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535
Abstract: 本说明书公开了一种推荐处理方法、装置、存储介质及电子设备,其中,方法包括:获取针对目标推荐任务的用户特征、项目特征以及场景上下文特征,将用户特征、项目特征以及场景上下文特征输入至推荐处理模型,推荐处理模型包括目标推荐任务下多个推荐项目场景分别对应的场景专家网络,对场景上下文特征进行输入特征筛选得到每个场景专家网络的目标场景上下文特征,基于各目标场景上下文特征、用户特征和项目特征,采用各场景专家网络进行任务推荐得到目标任务推荐结果,通过推荐处理模型输出目标任务推荐结果。
-
公开(公告)号:CN119647600A
公开(公告)日:2025-03-18
申请号:CN202411756512.0
申请日:2024-12-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种事务处理方法、装置、存储介质及电子设备,其中,方法包括:基于基础大模型创建初始事务处理大模型,将样本用户查询提示输入至初始事务处理大模型进行模型训练,在正向传播模型训练过程中,通过初始事务处理大模型对样本用户查询提示进行事务预处理得到参考处理结果和样本参考查询提示,基于样本用户查询提示以及样本参考查询提示采用交叉注意力机制进行事务处理得到预测处理结果,在反向传播模型训练过程中,基于预测处理结果、参考处理结果、样本用户查询提示以及样本参考查询提示确定模型损失,基于模型损失对初始事务处理大模型进行模型参数调整,得到事务处理大模型。
-
公开(公告)号:CN119089042A
公开(公告)日:2024-12-06
申请号:CN202411140267.0
申请日:2024-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/906 , G06F18/24 , G06N3/096 , G06N3/094 , G06N3/0455
Abstract: 本说明书实施例提出一种模型训练方法、推荐数据点击率的预测方法和电子设备,上述模型训练方法中,获取目标域样本数据和所述目标样本数据对应的点击率的标签值之后,首先分别通过学生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成参数调整的老师模型中的域分类器,获得域共享表征向量和域独有表征向量,然后根据域共享表征向量和域独有表征向量,通过学生模型中的点击率预测模型获得目标域样本数据对应的点击率的第一预测值,最后,以最小化学生模型的损失函数为目的,调整点击率预测模型、第一表征解耦模型和第二表征解耦模型的参数,其中,学生模型的损失函数包括目标域样本数据对应的点击率的标签值和第一预测值之间的交叉熵。
-
公开(公告)号:CN116187411A
公开(公告)日:2023-05-30
申请号:CN202211621862.7
申请日:2022-12-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于元学习的模型训练方法、推荐方法和装置。所述基于元学习的模型训练方法包括:获取多个第一训练数据,所述第一训练数据包括第一产品数据、第一用户数据和第一标签,所述第一标签用于表示第一产品数据与第一用户数据是否关联;通过分析第一训练数据之间的相似性,构建多个训练任务;根据所述多个训练任务进行元学习,得到元模型;根据第二训练数据训练所述元模型,得到业务模型,所述第二训练数据包括第二产品数据、第二用户数据和第二标签,所述第二标签用于表示第二产品数据与第二用户数据是否关联,所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。本说明书实施例可以提高元学习的效果。
-
公开(公告)号:CN113487163A
公开(公告)日:2021-10-08
申请号:CN202110741178.1
申请日:2021-06-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于地理位置信息进行业务预测的方法及装置,在进行业务预测的方法中,获取用户的当前位置。确定该当前位置在层次编码方式下的目标位置编码。之后,针对该目标位置编码,利用滑动窗口提取对应的编码片段序列。将编码片段序列输入基于时序的神经网络模型,得到对应的特征向量。最后,至少将该特征向量输入业务预测模型,得到业务预测结果。
-
公开(公告)号:CN111310913A
公开(公告)日:2020-06-19
申请号:CN202010060268.X
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种数据处理方法、资产分配方法、模型、装置及设备。通过第一模型获取用户特征对应的第一表征向量,通过第二模型获取资产的属性特征对应的第二表征向量,然后根据第一表征向量和第二表征向量预测目标核销率。通过两个模型分别学习用户特征与核销率之间的隐含关系,以及资产的属性特征与核销率之间的隐含关系,再通过两个表征向量确定最终的核销率,在模型中学习特征之间的交互关系,可以避免过拟合的问题,以及模型训练速度慢的问题,并且提高了预测得到的核销率的准确性。
-
-
-
-
-
-
-
-
-