-
公开(公告)号:CN113077058B
公开(公告)日:2022-07-15
申请号:CN202110460791.6
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F16/9536
Abstract: 本说明书实施例提供了一种由用户终端执行的推送模型优化方法,所述终端与第一用户相对应,所述终端本地包括当前的推送模型,所述推送模型基于矩阵分解方法进行预测,所述方法包括:从本地获取第一用户针对第一对象的评分;基于所述评分、所述第一用户的当前嵌入向量和所述第一对象的当前嵌入向量,计算用于优化所述第一对象的嵌入向量的第一梯度向量;确定所述第一用户的当前的预定数目的邻居用户;将所述第一梯度向量分别发送给所述预定数目的邻居用户各自的终端,以使得每个邻居用户的终端基于所述第一梯度向量分别优化其本地的第一对象的嵌入向量。
-
公开(公告)号:CN112926747B
公开(公告)日:2022-05-17
申请号:CN202110320906.1
申请日:2021-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种优化业务模型的方法及装置,适用于多个数据方基于隐私保护联合训练业务模型情况下,辅助确定业务模型的参数集的服务方。其中,业务模型的参数集用于描述其模型结构及至少一个超参数。该方法的一个实施方式包括:向各个数据方下发业务模型的当前参数集,以供各个数据方共同训练当前参数集对应的业务模型,并分别确定各自对应的模型局部性能,然后对各个数据方分别确定的各模型局部性能进行融合,得到针对当前参数集的当前全局性能,再利用当前全局性能和当前参数集、历史参数集与历史全局性能之间的关联关系,从而以最大化全局性能为目标,更新当前参数集。该实施方式有利于挖掘更有效的业务模型。
-
公开(公告)号:CN113033823B
公开(公告)日:2022-05-10
申请号:CN202110424366.1
申请日:2021-04-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书涉及一种模型训练方法、系统和装置,能够用于数据隐私保护。该方法包括,各训练成员将自身持有的训练样本的特征数据输入至模型的第一部分,得到初始输出矩阵;接收标签预测值,基于训练样本的标签值以及所述标签预测值确定损失函数值;将所述损失函数值传输给所述服务器,以便服务器基于所述损失函数值在模型的第二部分中反向传播梯度,直到获取输出梯度矩阵;基于所述损失函数相对模型的第一部分中各层的输出数据的梯度,继续反向传播梯度,以对模型的第一部分的模型参数进行更新;基于更新后的模型的第一部分进行下一轮迭代更新,或者基于此确定最终模型的第一部分。
-
公开(公告)号:CN112766514B
公开(公告)日:2021-12-24
申请号:CN202110086857.X
申请日:2021-01-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种联合训练机器学习模型的方法、系统及装置,用于数据隐私保护,所述方法包括:获取公共训练样本;通过本地待训练模型处理公共训练样本,获得第一预测集;将第一预测集发送给服务器;从服务器获取聚合预测集;基于聚合预测集与公共训练样本的标签值计算第一损失函数,并基于第一损失函数更新模型参数,获得一次更新的本地待训练模型;通过一次更新的本地待训练模型处理私有训练样本,获得第二预测集;基于第二预测集与私有训练样本的标签值计算第二损失函数,并基于第二损失函数更新模型参数,获得二次更新的本地待训练模型;将二次更新的本地待训练模型作为下一轮迭代更新中的本地待训练模型,或者基于此确定最终模型。
-
公开(公告)号:CN113407988A
公开(公告)日:2021-09-17
申请号:CN202110580162.7
申请日:2021-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种控制通信量的确定业务数据特征有效值的方法及装置。业务数据属于隐私数据,多个参与方的业务数据可假定拼接成联合数据,其包括多个对象针对多个特征项的特征值。多方分别获取联合数据分片、样本的预测值分片以及模型参数分片。多方中的选定参与方,利用多方中的预测值分片重构完整的预测值数据;利用多方安全计算,通过多方交互,基于多方的联合数据分片和选定参与方的预测值数据,确定多方分别对应的相关性数据分片,其中包括多个特征项之间的相关性数据;采用显著性检验法,通过多方之间的安全交互,基于多方的模型参数分片和相关性数据分片中的对应数据,确定模型参数对应的特征项在提升业务预测模型效果上的有效值。
-
公开(公告)号:CN113379042A
公开(公告)日:2021-09-10
申请号:CN202110835599.0
申请日:2021-07-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种保护数据隐私的业务预测模型训练方法及装置。在训练过程中,成员设备利用自身持有的对象特征数据,通过业务预测模型进行预测,利用预测结果确定用于更新模型参数的更新参量,其中包括针对业务预测模型的多个计算层的多个子参量;利用多个子参量,将多个计算层划分成第一类计算层和第二类计算层,第一类计算层的子参量值在指定范围以内;对第一类计算层的子参量进行隐私处理,并输出处理后子参量。多个成员设备的处理后子参量可以被聚合成聚合子参量。成员设备可以获取第一类计算层的聚合子参量,并利用聚合子参量和第二类计算层的子参量,对模型参数进行更新。
-
公开(公告)号:CN113360514A
公开(公告)日:2021-09-07
申请号:CN202110753197.6
申请日:2021-07-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种联合更新模型的方法、装置及系统,在当前同步周期,各个数据方在利用本地训练样本在本地更新完模型对应的待同步参数后,可以利用本地当前的带宽,以及服务方针对单个同步周期的最大等待时长,确定在当前同步周期需向服务器上传的待同步参数数量。之后,可以根据需向服务器上传的待同步参数数量从待同步参数集中选择相应的待同步参数上传至服务方。服务方在最大等待时长到达时,将各个数据方分别发送的若干待同步参数进行聚合,形成同步参数集,反馈给各个数据方用于当前同步周期的数据同步。这种实施方式可以避免通信阻塞,提高训练效率。
-
公开(公告)号:CN111400766B
公开(公告)日:2021-08-06
申请号:CN202010220436.7
申请日:2020-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对隐私数据进行多方联合降维的方法和装置。其中多方中的各个数据持有方,对其本地拥有的隐私数据矩阵进行转置相乘运算,得到乘积矩阵后,使用第三方的公钥对乘积矩阵进行同态加密,然后,汇总到某个运算平台中进行同态加和操作,将同态加和结果发至第三方。第三方对同态加和结果解密,可得到主成分分析所需的协方差矩阵,进而确定出降维变换矩阵,广播给各个持有方。于是,各个持有方可以利用该降维变换矩阵进行降维处理。通过这样的方式,确保了各个持有方中隐私数据的安全。
-
公开(公告)号:CN111523686B
公开(公告)日:2021-08-03
申请号:CN202010326265.6
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。
-
公开(公告)号:CN111143878B
公开(公告)日:2021-08-03
申请号:CN201911334589.8
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及一种基于隐私数据进行模型训练的方法及系统。所述的方法包括:第二终端接收来自第一终端的加密后的第一隐私数据;并将其与第二终端的第二隐私数据的加密数据进行计算,得到加密后的结果;第二终端基于所述加密后的结果以及样本标签,得到基于所述第一隐私数据和所述第二隐私数据联合训练的模型的加密损失值;将所述加密损失值参与加密模型训练,得到完成一次参数更新的模型;其中,所述加密为同态加密;所述第一隐私数据和所述第二隐私数据对应于相同样本的不同特征以及模型参数。
-
-
-
-
-
-
-
-
-