-
公开(公告)号:CN114781000B
公开(公告)日:2022-09-20
申请号:CN202210702081.4
申请日:2022-06-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种针对大规模数据的对象特征之间相关性的确定方法及装置。多方联合利用多方安全计算检测样本特征是否符合正态分布,当符合时,各方联合对样本进行安全标准化,之后进行随机采样,并对大规模数据进行选取,进而得到特征采样分片,然后各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的皮尔逊积矩相关系数。当检测出样本特征不符合正态分布时,参与方对特征矩阵中的特征值进行排序,并采用序号值分片代替特征值分片,接着进行随机采样,进一步得到排序数据的采样分片。然后,各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的斯皮尔曼等级相关系数。整个处理过程对隐私数据进行了保护。
-
公开(公告)号:CN114996449A
公开(公告)日:2022-09-02
申请号:CN202210574168.8
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护的多方联合数据聚类的方法及装置,第一方和第二方分别持有用于构成待聚类的所有样本对象的总特征矩阵的第一特征矩阵和第二特征矩阵;方法通过第一方执行,包括多轮迭代,任意一轮迭代包括:基于第一特征矩阵及第一质心分片,与第二方执行第一多方安全计算,得到距离矩阵的第一距离分片,距离矩阵的第二距离分片由第二方持有;基于第一距离分片,与第二方持有的第二距离分片执行安全比较计算,得到类簇索引矩阵的第一索引分片,类簇索引矩阵的第二索引分片由第二方持有;基于第一特征矩阵及第一索引分片,与第二方执行第二多方安全计算,得到本轮迭代更新后的第一质心分片,更新后的第二质心分片由第二方持有。
-
公开(公告)号:CN110969243B
公开(公告)日:2022-07-22
申请号:CN201911206347.0
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种防止隐私泄漏的对抗生成网络训练方法,包括:首先,利用生成器生成多个模拟样本,分为N组;接着,基于第i组模拟样本和第一类别标识,N组真实样本中的第i组真实样本和第二类别标识,以及针对判别器预先设定的损失函数,确定对应于判别器中M个模型参数的M个原始梯度值,组成第i组对应的第i个原始梯度向量,其中真实样本包括隐私数据;然后,分别对所述N组对应的N个原始梯度向量进行梯度裁剪,得到N个裁剪梯度向量;再接着,对所述N个裁剪梯度向量进行平均,得到平均梯度向量;再然后,利用所述平均梯度向量,调整所述M个模型参数,其中M、N、i为正整数,并且M、N≥2,i≤N。
-
公开(公告)号:CN110751330B
公开(公告)日:2022-07-22
申请号:CN201910995202.7
申请日:2019-10-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于树模型的预测方法和装置,其中,所述方法由树模型的模型拥有方执行、针对数据拥有方中的第一对象进行预测,所述方法包括:对n个节点确定随机排列顺序;依据随机排列顺序依次对n个节点中的每个节点执行:将该节点对应的第一特征发送给数据拥有方;与数据拥有方共同执行比较计算,以获取该节点的特征分裂值与第一对象的第一特征的特征值的比较结果,所述比较计算使得对于模型拥有方隐藏第一对象的第一特征的特征值,对于数据拥有方隐藏该节点的特征分裂值;基于n个节点中每个节点的所述比较结果、n个节点中每个节点在所述树模型中的位置,通过所述树模型输出对所述第一对象的预测结果。
-
公开(公告)号:CN114723012A
公开(公告)日:2022-07-08
申请号:CN202210390305.2
申请日:2022-04-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种基于分布式训练系统的计算方法和装置。分布式训练系统包括多个训练成员,多个训练成员包括多种角色,多种角色中的不同角色的训练成员在机器学习模型的训练过程中执行不同的操作,该方法应用于多个训练成员中的第一训练成员,该方法包括:获取多个模型,多个模型分别用于定义与机器学习模型的训练相关的多种计算操作;将多个模型输入至分布式模型,以对分布式模型进行初始化,分布式模型具有第一函数,第一函数用于定义多种角色在训练过程中各自需要执行的计算操作和通信操作;在训练过程中,根据分布式模型,执行第一训练成员的角色对应的计算操作和通信操作。
-
公开(公告)号:CN114707662A
公开(公告)日:2022-07-05
申请号:CN202210398878.X
申请日:2022-04-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书的实施例提供一种联邦学习方法、装置及联邦学习系统。联邦学习系统包括至少两个第一成员设备和第二成员设备,第一成员设备具有用于全局模型训练的本地数据。在各个第一成员设备处,使用本地数据训练全局模型得到各个模型参数的本地参数更新量;从全局模型的模型参数中选择适合于本地训练的部分模型参数;并将所选择的模型参数的本地参数更新量发送给第二成员设备。在第二成员设备处,使用从各个第一成员设备接收的本地参数更新量重构全局模型的各个模型参数的参数更新量;基于所述重构的各个模型参数的参数更新量进行全局模型更新;以及将更新后的全局模型作为下一模型训练过程的全局模型发送给各个第一成员设备。
-
公开(公告)号:CN114707661A
公开(公告)日:2022-07-05
申请号:CN202210383948.4
申请日:2022-04-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例公开了一种对抗训练方法和系统。所述方法包括:基于多个训练样本,对目标模型进行多轮迭代的对抗训练。其中一轮迭代包括:根据训练样本的信息增益,从所述多个训练样本中选取参与当前轮对抗训练的当前轮训练样本,其中,训练样本的信息增益与基于该训练样本生成的对抗样本对目标模型的威胁强度正相关;基于所述当前轮训练样本对目标模型进行对抗训练,以提高目标模型抵御对抗攻击的能力。
-
公开(公告)号:CN114638376A
公开(公告)日:2022-06-17
申请号:CN202210302971.6
申请日:2022-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种复合样本场景中的多方联合模型训练方法及装置。若干个第一类设备拥有水平切分数据,若干个第二类设备拥有垂直切分数据。服务器针对任一个第一类设备,将该第一类设备和所有第二类设备中匹配的样本标识对应的样本作为一个训练单元中的样本,并确定该训练单元的样本信息,将其发送至所有第二类设备。第二类设备基于多个训练单元的样本信息,将自身的全部样本拆分成与多个训练单元分别对应的样本组。服务器从多个训练单元中确定待训练的训练单元,向该训练单元关联的设备发送训练通知。该训练单元关联的设备基于各自拥有的样本中分别属于该训练单元的样本组,对网络模型进行联合训练,训练过程保护了各方样本的隐私数据。
-
公开(公告)号:CN114282256B
公开(公告)日:2022-06-07
申请号:CN202210205844.4
申请日:2022-03-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60
Abstract: 本说明书的一些实施例涉及信息安全技术领域,特别涉及一种基于秘密分享的排序打乱方法和恢复方法。其中,该排序打乱方法中第一参与方持有第一序列的第一分片;第二参与方持有第一序列的第二分片;通过执行秘密分享排列协议,第一参与方获得第一乱序序列的第一分片,第二参与方获得第一乱序序列的第二分片;该排序恢复方法用于上述方法打乱得到的第一乱序序列进行恢复,得到第一序列。
-
公开(公告)号:CN114172648B
公开(公告)日:2022-05-31
申请号:CN202210126038.8
申请日:2022-02-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于秘密分享的排序方法和系统。该方法应用于第一参与方,第一参与方持有主键序列的第一分片和待排序序列的第一分片,该方法包括:基于主键序列的第一分片与第二参与方协同,通过秘密分享排列协议,获取主键乱序序列的第一分片。基于待排序序列的第一分片与第二参与方协同,通过秘密分享排列协议,获取待排序乱序序列的第一分片。基于主键乱序序列的第一分片与第二参与方协同,通过秘密分享比较协议,获取主键乱序序列的排序序列;排序序列能够将主键乱序序列进行升序或降序排序。基于排序序列对待排序乱序序列的第一分片进行排序处理,获得目标序列的第一分片,目标序列等于待排序序列按主键序列升序或降序排列的结果。
-
-
-
-
-
-
-
-
-