-
公开(公告)号:CN111475852A
公开(公告)日:2020-07-31
申请号:CN202010567562.X
申请日:2020-06-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护针对业务模型进行数据预处理的方法,在对业务模型进行数据预处理过程中,从各个业务方接收扰动后的隐私数据,并基于隐私数据统一训练业务模型,从而向各个业务方提供训练好的业务模型。其中,各个业务方对隐私数据进行扰动过程中,采用预先确定分布的扰动数据,并利用这种分布一致的扰动数据可以由一份通用扰动数据代替的特性,将样本距离近似为通用扰动数据的数值计算。基于这种原理计算损失,并采取特定的技术特征,使得各个业务方在基于隐私保护的业务模型的数据预处理过程中,减少通信量以及计算量,提高数据处理效率。
-
公开(公告)号:CN111445282A
公开(公告)日:2020-07-24
申请号:CN202010203021.9
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/02 , G06F16/9535
Abstract: 本说明书一个或多个实施例提供了一种基于用户行为的业务处理方法、装置及设备,在基于用户行为的业务处理方法中,分别对第一用户行为特征向量和第一广告特征向量进行压缩后,将得到的第二用户行为特征向量以及第二广告特征向量进行特征交叉,得到注意力机制参数,再将该注意力机制参数与第一用户行为特征向量进行特征交叉,得到用户行为的向量表示,从而可根据用户的行为充分学习到用户对每个广告的差别,有助于更好的挖掘用户的兴趣的多样性。
-
公开(公告)号:CN111368337A
公开(公告)日:2020-07-03
申请号:CN202010459358.6
申请日:2020-05-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的样本生成模型构建、仿真样本生成方法及装置,在样本生成模型构建方法中,对真实样本集中多个真实样本进行聚类,确定N个类簇。对于N个类簇中任意的第一类簇,基于归属于第一类簇的各真实样本,训练对应于第一类簇的、具有差分隐私功能的子生成模型。基于N个类簇分别对应的N个子生成模型,形成样本生成模型。该样本生成模型用于基于原始样本生成对应的仿真样本。
-
公开(公告)号:CN111340227A
公开(公告)日:2020-06-26
申请号:CN202010409973.6
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例提供一种通过强化学习模型对业务模型进行压缩的方法和装置。方法包括,首先获取通过神经网络实现的业务模型,其包含N个网络层。依次将各个网络层作为当前层进行剪枝操作,该操作包括,基于当前层的层特征确定环境状态,将环境状态输入强化学习模型,得到针对当前层的剪枝决策,据此进行剪枝;并在样本队列中添加当前层的剪枝记录,该记录包括环境状态和剪枝决策。然后,将验证数据集输入N个网络层均进行剪枝后的压缩模型,得到性能评估结果。根据该性能评估结果确定奖励分数,将奖励分数分别添加到N条剪枝记录中,形成N条训练样本。然后,根据样本队列中的训练样本,更新强化学习模型。
-
公开(公告)号:CN111325614A
公开(公告)日:2020-06-23
申请号:CN202010409708.8
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提出了一种电子对象的推荐方法、装置和电子设备,其中所述电子对象推荐方法,包括:获取已为第一用户推荐的多个电子对象的特征,根据所述多个电子对象的特征生成特征序列;获取候选电子对象特征,确定所述候选电子对象特征与所述特征序列包含的各特征之间的相关值;根据所述第一用户的用户特征和所述相关值,从候选电子对象中确定向第一用户推荐的电子对象,通过本说明书实施例方案能够提高电子对象推荐的匹配度。
-
公开(公告)号:CN118504655A
公开(公告)日:2024-08-16
申请号:CN202410601009.1
申请日:2024-05-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/096 , G06N3/045 , G06F18/22 , G06F18/2415 , G06F18/10
Abstract: 本说明书一个或多个实施例提供一种基于知识蒸馏的模型训练方法及装置,包括:获取样本集以及样本集中每个样本所对应的多源噪声标记组;基于样本集以及各个多源噪声标记组训练教师网络,并根据教师网络在各个标记源视角下分别对各个样本输出的概率值与相应标记源添加的噪声标记之间的相似度,确定各个标记源的可靠程度,可靠程度与相似度呈正相关;根据包含有硬标签损失部分与软标签损失部分的蒸馏损失函数对学生网络进行训练;其中,每一多源噪声标记组中的各个噪声标记参与构建硬标签损失部分的概率,和/或教师网络针对同一样本分别在各个标记源视角下输出的概率值参与构建软标签损失部分的概率,与相应标记源的可靠程度呈正相关。
-
公开(公告)号:CN118395955A
公开(公告)日:2024-07-26
申请号:CN202410481673.7
申请日:2024-04-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/186 , G06F40/30 , G06F18/213 , G06F18/214 , G06F18/241 , G06F18/27
Abstract: 本说明书实施例提供了一种大语言模型微调方法、样本特征补全方法及装置。将任意一个样本包含的若干特征及其特征值转换成语言文本,该样本包含的某个特征的特征值用于作为待预测特征的标签数据,并且从语言文本中去除该特征的特征值;接着,利用该语言文本和该特征生成提示模板,对大语言模型进行微调。在对大语言模型进行微调后,利用大语言模型基于该语言文本对该特征的特征值进行预测,基于预测值对样本的缺失特征值进行补全。样本特征包含隐私数据,使用大语言模型对样本的缺失特征进行补全时,需要进行隐私保护。
-
公开(公告)号:CN118152664A
公开(公告)日:2024-06-07
申请号:CN202410417336.1
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9536 , G06Q30/0207 , G06F18/25 , G06F18/22 , G06F18/24 , G06N3/08 , G06N3/04
Abstract: 本说明书实施例提供一种权益推送模型的数据预处理方法及装置,以及确定权益推送策略的方法及装置,通过用户塔网络和权益塔网络的双塔网络模型,一方面,在用户塔网络中按照根据预定推送偏好信息划分的用户类别设置处理单元,另一方面,在权益塔网络中,按照权益类别设置处理单元,最终将用户塔网络得到的用户表征向量和权益塔网络得到的权益表征向量进行匹配,以实现在预定人工策略下向用户的无偏权益推送策略确定,从而提高包含预定策略的干扰因子的情况下的权益推送准确度。
-
公开(公告)号:CN116596093A
公开(公告)日:2023-08-15
申请号:CN202310623027.5
申请日:2023-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供了推荐模型的训练方法及装置,推荐模型的训练方法包括:获取混合场景样本集,混合场景样本集包括多个推荐项的特征数据,且该多个推荐项的特征数据对应于多个不同的场景;根据混合场景样本集,对初始推荐模型进行模型训练,得到中间推荐模型;初始推荐模型包括多目标单元和预设目标集合中每个推荐目标对应的多场景单元;多目标单元包括多个专家子单元、每个推荐目标对应的门控子单元以及每个推荐目标对应的归一化子单元;获取多个单场景样本集;根据每个单场景样本集,分别对中间推荐模型进行模型训练,得到推荐模型;推荐模型用于确定推荐项,该推荐项在预设场景中满足由预设场景和每个推荐目标确定的多目标推荐条件。
-
公开(公告)号:CN116468538A
公开(公告)日:2023-07-21
申请号:CN202310364914.5
申请日:2023-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F18/214 , G06N3/04 , G06N5/01 , G06N20/00
Abstract: 本说明书实施例公开了一种风险检测模型训练方法、装置、存储介质及设备。该方法包括:对第一样本数据进行规则学习,得到与第一样本数据对应的风险检测规则,第一样本数据包括未标记样本和标记风险样本,未标记样本的数量大于标记风险样本的数量;基于风险检测规则对第一样本数据中的未标记样本进行标记,得到第二样本数据,第二样本数据包括潜在风险样本、潜在正常样本以及标记风险样本;基于第二样本数据,对风险检测模型进行训练。
-
-
-
-
-
-
-
-
-