-
公开(公告)号:CN113407988B
公开(公告)日:2025-02-25
申请号:CN202110580162.7
申请日:2021-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种控制通信量的确定业务数据特征有效值的方法及装置。业务数据属于隐私数据,多个参与方的业务数据可假定拼接成联合数据,其包括多个对象针对多个特征项的特征值。多方分别获取联合数据分片、样本的预测值分片以及模型参数分片。多方中的选定参与方,利用多方中的预测值分片重构完整的预测值数据;利用多方安全计算,通过多方交互,基于多方的联合数据分片和选定参与方的预测值数据,确定多方分别对应的相关性数据分片,其中包括多个特征项之间的相关性数据;采用显著性检验法,通过多方之间的安全交互,基于多方的模型参数分片和相关性数据分片中的对应数据,确定模型参数对应的特征项在提升业务预测模型效果上的有效值。
-
公开(公告)号:CN118520968A
公开(公告)日:2024-08-20
申请号:CN202310173405.4
申请日:2023-02-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/27 , G06F18/214 , G06F21/60 , G06F21/62
Abstract: 本说明书实施例提供一种联合训练复合泊松伽马回归模型的方法及装置,涉及n个参与方。该方法由其中任意的第i个参与方执行,包括:先与其他的n‑1个参与方共同进行针对训练样本集的秘密分享分片,得到第i个特征分片和第i个标签分片;再基于这两个分片,与其他的n‑1个参与方联合进行对应复合泊松伽马回归模型的第i个参数分片的多轮次迭代更新,模型参数分片的迭代更新可以按需选用设计的多种模型优化器之一,例如,适用于小规模数据的安全迭代重加权最小二乘法、适用于大规模数据的安全批次迭代重加权最小二乘法、大小规模数据都适用的安全随机梯度下降法等,如此可以提高执行效率。另外,各种模型优化器涉及的密文运算为秘密分享运算,使得执行更加高效。
-
公开(公告)号:CN114781000B
公开(公告)日:2022-09-20
申请号:CN202210702081.4
申请日:2022-06-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种针对大规模数据的对象特征之间相关性的确定方法及装置。多方联合利用多方安全计算检测样本特征是否符合正态分布,当符合时,各方联合对样本进行安全标准化,之后进行随机采样,并对大规模数据进行选取,进而得到特征采样分片,然后各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的皮尔逊积矩相关系数。当检测出样本特征不符合正态分布时,参与方对特征矩阵中的特征值进行排序,并采用序号值分片代替特征值分片,接着进行随机采样,进一步得到排序数据的采样分片。然后,各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的斯皮尔曼等级相关系数。整个处理过程对隐私数据进行了保护。
-
公开(公告)号:CN114996449A
公开(公告)日:2022-09-02
申请号:CN202210574168.8
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护的多方联合数据聚类的方法及装置,第一方和第二方分别持有用于构成待聚类的所有样本对象的总特征矩阵的第一特征矩阵和第二特征矩阵;方法通过第一方执行,包括多轮迭代,任意一轮迭代包括:基于第一特征矩阵及第一质心分片,与第二方执行第一多方安全计算,得到距离矩阵的第一距离分片,距离矩阵的第二距离分片由第二方持有;基于第一距离分片,与第二方持有的第二距离分片执行安全比较计算,得到类簇索引矩阵的第一索引分片,类簇索引矩阵的第二索引分片由第二方持有;基于第一特征矩阵及第一索引分片,与第二方执行第二多方安全计算,得到本轮迭代更新后的第一质心分片,更新后的第二质心分片由第二方持有。
-
公开(公告)号:CN113407987A
公开(公告)日:2021-09-17
申请号:CN202110564443.3
申请日:2021-05-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种保护隐私的确定业务数据特征有效值的方法及装置。业务数据分布在多个参与方中,多个参与方的业务数据能假定拼接成联合数据,其中包括多个对象针对多个特征项的特征值。多方分别获取联合数据分片、多个对象分别对应的预测值分片以及多个特征项分别对应的模型参数分片。这些预测值分片和模型参数分片均基于业务预测模型得到。多方可以利用多方安全计算,基于多方的联合数据分片和预测值分片,确定多方分别对应的相关性数据分片,其中包括多个特征项之间的相关性数据;然后,采用显著性检验法,基于多方的模型参数分片和相关性数据分片中的对应数据,确定模型参数对应的特征项在提升业务预测模型效果上的有效值。
-
公开(公告)号:CN112818290A
公开(公告)日:2021-05-18
申请号:CN202110084215.6
申请日:2021-01-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多方联合确定隐私数据中对象特征相关性的方法及装置。隐私数据分布在多个持有方中,第一持有方针对第一原始矩阵中多项特征的特征值进行零均值化,得到第一中心矩阵;利用多方安全计算,基于第一中心矩阵以及其他持有方各自的中心矩阵,确定协方差矩阵的第一分片矩阵。针对第一持有方中的第i特征与第二持有方中的第j特征,第一持有方从本地的协方差矩阵分片、本地存储的特征数据中获取数据,并利用多方安全计算,基于第二持有方的本地特征数据,确定第i特征与第j特征之间的第一相关性系数分片。
-
公开(公告)号:CN111783130B
公开(公告)日:2021-01-29
申请号:CN202010919436.6
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种隐私保护的数据处理方法、装置及服务器。一个方法实施例中,将秘密分享中的加法分片转化成乘法分片,进而可在基于隐私保护的浮点数平方根倒数算法中引入快速平方根算法的高精度初始化,从而减少后续基于隐私保护的牛顿法的迭代次数,在保护用户隐私的同时提高了算法效率,提高了计算设备的处理性能。
-
公开(公告)号:CN111931216A
公开(公告)日:2020-11-13
申请号:CN202010974956.7
申请日:2020-09-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60
Abstract: 本说明书一个或多个实施例涉及一种基于隐私保护的方式获取联合训练模型的方法及系统,所述方法由参与方中的第一终端实现;其中,所述参与方包括第一终端与第二终端,分别持有水平或者垂直切分的训练数据,所述训练数据包括含样本标签的第一训练数据以及不含样本标签的第二训练数据;所述方法包括:基于含样本标签的所述第一训练数据通过隐私保护的方式与所述参与方中的第二终端联合训练第一模型;将不含标签的第二训练数据通过隐私保护的方式输入训练好的所述第一模型得到第二训练数据的预测标签;基于含样本标签的第一训练数据以及含预测标签的第二训练数据通过隐私保护的方式与所述第二终端联合训练模型,获取第二模型。
-
公开(公告)号:CN110889447A
公开(公告)日:2020-03-17
申请号:CN201911174424.9
申请日:2019-11-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于多方安全计算检验线性回归模型的特征显著性的方法和装置,所述方法由多个数据持有方中第一数据持有方的设备执行,多个数据持有方各自的设备中共同存储了N个样本和所述模型的模型参数,所述方法包括:与其它数据持有方的设备联合执行基于秘密分享的矩阵加法和矩阵乘法,获取所述N个样本的误差平方和;与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值;计算与第j个t检验值对应的第二数值;与其它数据持有方的设备联合执行基于秘密分享的矩阵加法,获取所述第j个t检验值,以基于所述第j个t检验值确定所述线性回归模型的相应特征的显著性。
-
公开(公告)号:CN118520965A
公开(公告)日:2024-08-20
申请号:CN202310135341.9
申请日:2023-02-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/27 , G06F18/214 , G06F21/60 , G06F21/62
Abstract: 本说明书实施例提供一种联合训练泊松回归模型的方法及装置,涉及n个参与方。该方法由其中任意的第i个参与方执行,包括:先与其他的n‑1个参与方共同进行针对训练样本集的秘密分享分片,得到第i个特征分片和第i个标签分片;再基于第i个特征分片和第i个标签分片,与其他的n‑1个参与方联合进行对应泊松回归模型的第i个参数分片的多轮次迭代更新,模型参数分片的迭代更新可以按需选用设计的多种模型优化器之一,例如,适用于小规模数据的安全迭代重加权最小二乘法、适用于大规模数据的安全批次迭代重加权最小二乘法、大小规模数据都适用的安全随机梯度下降法等,如此可以提高执行效率。另外,各种模型优化器涉及的密文运算为秘密分享运算,使得执行更加高效。
-
-
-
-
-
-
-
-
-