-
公开(公告)号:CN114996449B
公开(公告)日:2024-06-28
申请号:CN202210574168.8
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F18/23213 , G06F21/62
Abstract: 本说明书实施例提供一种基于隐私保护的多方联合数据聚类的方法及装置,第一方和第二方分别持有用于构成待聚类的所有样本对象的总特征矩阵的第一特征矩阵和第二特征矩阵;方法通过第一方执行,包括多轮迭代,任意一轮迭代包括:基于第一特征矩阵及第一质心分片,与第二方执行第一多方安全计算,得到距离矩阵的第一距离分片,距离矩阵的第二距离分片由第二方持有;基于第一距离分片,与第二方持有的第二距离分片执行安全比较计算,得到类簇索引矩阵的第一索引分片,类簇索引矩阵的第二索引分片由第二方持有;基于第一特征矩阵及第一索引分片,与第二方执行第二多方安全计算,得到本轮迭代更新后的第一质心分片,更新后的第二质心分片由第二方持有。
-
公开(公告)号:CN113407987B
公开(公告)日:2023-10-20
申请号:CN202110564443.3
申请日:2021-05-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种保护隐私的确定业务数据特征有效值的方法及装置。业务数据分布在多个参与方中,多个参与方的业务数据能假定拼接成联合数据,其中包括多个对象针对多个特征项的特征值。多方分别获取联合数据分片、多个对象分别对应的预测值分片以及多个特征项分别对应的模型参数分片。这些预测值分片和模型参数分片均基于业务预测模型得到。多方可以利用多方安全计算,基于多方的联合数据分片和预测值分片,确定多方分别对应的相关性数据分片,其中包括多个特征项之间的相关性数据;然后,采用显著性检验法,基于多方的模型参数分片和相关性数据分片中的对应数据,确定模型参数对应的特征项在提升业务预测模型效果上的有效值。
-
公开(公告)号:CN114969846A
公开(公告)日:2022-08-30
申请号:CN202210466963.5
申请日:2022-04-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多方联合训练逻辑回归模型的方法,所述多方各自持有形成训练样本集的部分数据,所述方法应用于多方中任意的第一方;所述方法涉及多期训练,其中任一期包括:获取本期针对所述训练样本集划分出的多个批次;针对所述多个批次中的每个批次,基于该批次训练样本的第一特征分片和第一标签分片,以及所述逻辑回归模型的第一参数分片,确定第一损失分片,用于还原该批次对应的训练损失;在所述第一方为指定方的情况下,基于所述多个批次对应的多个训练损失,确定本期训练损失,用于评估本期训练后的逻辑回归模型的收敛状态。
-
公开(公告)号:CN111460528B
公开(公告)日:2022-06-14
申请号:CN202010248683.8
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及一种基于Adam优化算法的多方联合训练方法及系统。所述方法包括:基于各个数据持有终端的通信状态确定参与模型参数更新的训练成员;服务器通过多方安全计算的方式获取累计数据;所述累计数据由所述训练成员基于自身的训练数据及其对应的模型参数确定;服务器基于所述累计数据以及样本标签参与累计梯度值的计算;所述累计梯度值用于所述训练成员计算自身的一阶矩和二阶矩,并基于所述一阶矩和二阶矩完成模型参数的更新;所述各个数据终端分别持有自身的训练数据以及与所述训练数据对应的模型参数;所述训练数据包括与实体相关的图像数据、文本数据或声音数据。其中,所述训练数据可以包括私有数据。
-
公开(公告)号:CN110889447B
公开(公告)日:2022-05-17
申请号:CN201911174424.9
申请日:2019-11-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于多方安全计算检验线性回归模型的特征显著性的方法和装置,所述方法由多个数据持有方中第一数据持有方的设备执行,多个数据持有方各自的设备中共同存储了N个样本和所述模型的模型参数,所述方法包括:与其它数据持有方的设备联合执行基于秘密分享的矩阵加法和矩阵乘法,获取所述N个样本的误差平方和;与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值;计算与第j个t检验值对应的第二数值;与其它数据持有方的设备联合执行基于秘密分享的矩阵加法,获取所述第j个t检验值,以基于所述第j个t检验值确定所述线性回归模型的相应特征的显著性。
-
公开(公告)号:CN112597540A
公开(公告)日:2021-04-02
申请号:CN202110115832.8
申请日:2021-01-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供基于隐私保护的多重共线性检测方案。该多重共线性检测方案由多个成员设备执行,每个成员设备具有本地特征数据。各个成员设备对各自的本地特征数据执行数据对齐来构建出联合特征矩阵,并且协同来执行基于隐私保护的多方矩阵乘法计算,求出联合特征矩阵与其转置矩阵的乘积矩阵,每个成员设备具有乘积矩阵的乘积矩阵分片。然后,各个成员设备使用各自的乘积矩阵分片联合确定乘积矩阵的逆矩阵,每个成员设备具有逆矩阵的逆矩阵分片。随后,各个成员设备使用各自的逆矩阵分片以及本地特征数据确定样本数据的各个属性特征的方差膨胀因子,每个成员设备具有各个属性特征的方差膨胀因子的分片数据,并根据各自具有的各个属性特征的方差膨胀因子的分片数据来确定多重共线性。
-
公开(公告)号:CN111931216B
公开(公告)日:2021-03-30
申请号:CN202010974956.7
申请日:2020-09-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60
Abstract: 本说明书一个或多个实施例涉及一种基于隐私保护的方式获取联合训练模型的方法及系统,所述方法由参与方中的第一终端实现;其中,所述参与方包括第一终端与第二终端,分别持有水平或者垂直切分的训练数据,所述训练数据包括含样本标签的第一训练数据以及不含样本标签的第二训练数据;所述方法包括:基于含样本标签的所述第一训练数据通过隐私保护的方式与所述参与方中的第二终端联合训练第一模型;将不含标签的第二训练数据通过隐私保护的方式输入训练好的所述第一模型得到第二训练数据的预测标签;基于含样本标签的第一训练数据以及含预测标签的第二训练数据通过隐私保护的方式与所述第二终端联合训练模型,获取第二模型。
-
公开(公告)号:CN111783130A
公开(公告)日:2020-10-16
申请号:CN202010919436.6
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种隐私保护的数据处理方法、装置及服务器。一个方法实施例中,将秘密分享中的加法分片转化成乘法分片,进而可在基于隐私保护的浮点数平方根倒数算法中引入快速平方根算法的高精度初始化,从而减少后续基于隐私保护的牛顿法的迭代次数,在保护用户隐私的同时提高了算法效率,提高了计算设备的处理性能。
-
公开(公告)号:CN111400766A
公开(公告)日:2020-07-10
申请号:CN202010220436.7
申请日:2020-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对隐私数据进行多方联合降维的方法和装置。其中多方中的各个数据持有方,对其本地拥有的隐私数据矩阵进行转置相乘运算,得到乘积矩阵后,使用第三方的公钥对乘积矩阵进行同态加密,然后,汇总到某个运算平台中进行同态加和操作,将同态加和结果发至第三方。第三方对同态加和结果解密,可得到主成分分析所需的协方差矩阵,进而确定出降维变换矩阵,广播给各个持有方。于是,各个持有方可以利用该降维变换矩阵进行降维处理。通过这样的方式,确保了各个持有方中隐私数据的安全。
-
公开(公告)号:CN110889139A
公开(公告)日:2020-03-17
申请号:CN201911174422.X
申请日:2019-11-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对用户隐私数据进行多方联合降维的方法和装置。其中多方中的各个数据持有方本地拥有部分用户数据作为隐私数据。为了保证各个持有方隐私数据安全,将有待基于各方隐私数据形成的协方差矩阵拆解为各个持有方可以本地计算或者可以通过秘密分享的矩阵乘法SMM进行安全计算的矩阵;并且,通过安全多方计算MPC的方式,共同确定出协方差矩阵的本征矩阵。如此,各个持有方可以基于本征矩阵对本地数据进行降维,并最终形成降维的用户特征数据。通过这样的方式,确保了用户隐私数据的安全。
-
-
-
-
-
-
-
-
-