-
公开(公告)号:CN115345296A
公开(公告)日:2022-11-15
申请号:CN202210968303.7
申请日:2022-08-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,其中多任务模型包括用于确定用户表征的主干网络,以及用于基于用户表征执行k项用户预测任务的k个头部网络。该方法包括:基于m个用户样本,确定k项用户预测任务针对主干网络的k组原始梯度向量,其中各个用户样本包括用户特征和k个用户标签;将k组原始梯度向量映射至其所在原始空间的子空间,得到k组映射梯度向量;基于k组映射梯度向量在子空间的r个空间维度上的分量分布,确定对应的r个权重,并利用r个权重分别对各个映射梯度向量的r个维度分量进行加权处理,得到k组加权梯度向量;将k组加权梯度向量映射回原始空间,得到k组处理梯度向量,用以更新主干网络的网络参数。
-
公开(公告)号:CN116975686A
公开(公告)日:2023-10-31
申请号:CN202310907307.9
申请日:2023-07-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种训练学生模型的方法、行为预测方法和装置,该方法基于教师模型以及桥模型来训练学生模型,该方法包括:将原始特征数据输入第一嵌入层,得到第一嵌入特征并输入训练好的教师模型、以及桥模型,得到第一和第二预测结果并根据其更新桥模型;将第一嵌入特征输入桥模型所包括的桥特征提取网络、以及学生模型包括的学生特征提取网络,得到第一桥提取向量和学生提取向量,并根据其确定交互蒸馏损失;将原始特征数据输入第二嵌入层,得到第二嵌入特征并输入桥特征提取网络,得到第二桥提取向量;根据第一和第二桥提取向量,确定嵌入蒸馏损失;至少根据交互蒸馏损失和嵌入蒸馏损失,确定综合损失并根据其更新学生模型。
-
公开(公告)号:CN115841016A
公开(公告)日:2023-03-24
申请号:CN202211275449.X
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F30/20 , G06F119/02
Abstract: 本说明书实施例公开了一种基于特征选择的模型训练方法、装置以及设备。通过获取所述M个任务的共享特征Z;针对第k个任务,根据所述共享特征Z确定特征对于任务的权重向量,根据所述共享特征和所述权重向量确定第k个任务的第一预测结果;针对第i个特征,将所述共享特征Z中的第i行替换为预设值,生成修改后的共享特征,根据所述修改后的共享特征确定第k个任务的第二预测结果;根据所述第一预测结果和所述第二预测结果的差异确定第i个特征对于第k个任务的因果效应因子;确定所述因果效应因子和所述权重向量的差异,根据所述差异生成损失值对所述多任务模型进行训练,从而实现在训练过程中为每个任务选择性地学习具有因果关系的特征。
-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。
-
公开(公告)号:CN119807489A
公开(公告)日:2025-04-11
申请号:CN202411997061.X
申请日:2024-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/9038 , G06F16/9032 , G06N5/022 , G06N3/0455
Abstract: 本说明书实施例提供了一种确定查询‑项目对的相关性的方法及装置。该方法包括:基于目标搜索引擎的用户的历史行为数据,获取目标查询‑目标项目对的邻居集合,所述邻居集合包括以下至少一个集合:所述目标查询对应的第一项目的第一集合,所述目标项目对应的第一查询的第二集合;基于所述目标查询‑目标项目对和所述邻居集合,构建目标提示信息;将所述目标提示信息输入大语言模型,得到所述大语言模型输出的所述目标查询‑目标项目对的相关性分数。
-
公开(公告)号:CN119538984A
公开(公告)日:2025-02-28
申请号:CN202411659120.2
申请日:2024-11-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895
Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。
-
公开(公告)号:CN119599080A
公开(公告)日:2025-03-11
申请号:CN202411756260.1
申请日:2024-12-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0895 , G06N3/0475 , G06N3/0455 , G06F40/30 , G06F16/9535 , G06F16/9538 , G06Q30/0251 , G06Q30/0241
Abstract: 本说明书一个或多个实施例提供了一种生成式检索模型的训练方法、信息检索方法及装置。该训练方法采用两阶段训练策略。其中,第一阶段可以称为文档标识符生成阶段,该阶段利用一一对应的第一查询词条和第一标准文档标识符,训练待训练生成式检索模型学习查询与文档标识符之间的关系。第二阶段可以称为文档排名阶段,该阶段通过对比学习方法,利用一一对应的第二查询词条、第二正样本文档和负样本文档,训练第一阶段训练后的模型学习查询与文档之间的关系。
-
公开(公告)号:CN118840162A
公开(公告)日:2024-10-25
申请号:CN202410939815.X
申请日:2024-07-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0251 , G06F40/279 , G06F16/33 , G06N5/02
Abstract: 本说明书实施例提供一种目标人群选择方法、装置、设备与存储介质,该方法包括:通过获取事务方输入的人群需求描述数据,识别人群需求描述数据中的用户属性标签和实体标签,获取与实体标签相似的关联实体标签,基于关联实体标签和实体标签得到实体标签集合,将用户属性标签以及实体标签集合与人群数据库中的预存人群标签进行匹配,以得到预存人群标签中与用户属性标签以及实体标签集合对应的目标人群标签,基于目标人群标签在人群数据库中确定事务方所需求的目标人群。
-
公开(公告)号:CN117932164A
公开(公告)日:2024-04-26
申请号:CN202410139688.5
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/2457 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供的推荐方法、推荐模型的模型训练方法及设备,对历史行为序列中交互项的项标识与辅助信息进行融合;基于项标识信息、融合信息以及位置信息,通过位置解耦的融合自注意力模型确定各个交互项的融合项标识表征;基于各个交互项的融合项标识表征与候选项之间的匹配得分向用户推荐候选项。根据本说明书实施例的技术方案,能够消除位置信息与项标识、辅助信息之间的噪声干扰,并保留了项标识与辅助信息之间的强相关性,从而能够提高个性化推荐的准确性。
-
公开(公告)号:CN116611499A
公开(公告)日:2023-08-18
申请号:CN202310536954.3
申请日:2023-05-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/092 , G06F18/214 , G06Q30/0241 , G06Q30/0202 , G06Q30/0273
Abstract: 本说明书实施例披露一种训练用于自动出价的强化学习系统的方法及装置。其中强化学习系统包括环境模型和智能体,环境模型用于预测业务环境的状态分布,业务环境状态包括业务方的预算消耗和已获业务价值,智能体用于根据当前环境状态确定业务方的当前出价参数。所述方法包括:先利用多个历史样本训练环境模型,其中任意的第一历史样本包括业务环境的第一状态、第一出价参数,以及在第一状态下采用所述第一出价参数后业务环境变更为的第二状态;再利用基于环境状态空间和出价参数空间采样构建的多个状态‑出价参数对,以及将其中各个状态‑出价参数对输入训练好的环境模型而对应得到的预测状态分布,训练智能体。
-
-
-
-
-
-
-
-
-