-
公开(公告)号:CN111738361B
公开(公告)日:2020-12-08
申请号:CN202010759898.6
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种业务模型的联合训练方法及装置,在多方联合训练业务模型过程中,为了使用牛顿法以更快的收敛速度训练业务模型,在确定海森矩阵的逆矩阵时,引入由可信第三方生成的辅助矩阵,由联合训练业务模型的各个业务方以秘密共享方式来确定海森矩阵与辅助矩阵的乘积,并各自得到相应份额。之后,公开海森矩阵与辅助矩阵的乘积的合并结果,使各个业务方分别得到以上合并结果的逆矩阵,进而确定海森矩阵的逆矩阵的相应份额。根据这种特定的业务方交互方式设置,使得多方安全计算中,在保证数据隐私的前提下,利用牛顿法调整模型参数具有可行性,从而提高业务模型的联合训练效率。
-
公开(公告)号:CN111967035A
公开(公告)日:2020-11-20
申请号:CN202011144330.X
申请日:2020-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60
Abstract: 本说明书实施例公开了一种模型训练方法、装置和电子设备。所述方法包括:第一方根据特征数据和原始模型参数的第一份额与第二方秘密分享第一乘积,得到第一乘积的第一份额;向第三方发送第一乘积的第一份额;接收第三方发来的激励函数的取值的第一份额;根据特征数据和所述取值的第一份额与第二方秘密分享损失函数的梯度,得到所述梯度的第一份额;根据特征数据和所述取值的第一份额与第二方秘密分享海森矩阵,得到海森矩阵的第一份额;若海森矩阵的条件数满足预设条件,根据原始模型参数的第一份额、所述梯度的第一份额和海森矩阵的第一份额与第二方秘密分享新的模型参数,得到新的模型参数的第一份额。本说明书实施例可以保护数据隐私。
-
公开(公告)号:CN111144576A
公开(公告)日:2020-05-12
申请号:CN201911282429.3
申请日:2019-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供模型训练方法、装置和电子设备的实施例。所述方法包括:根据特征数据,将样本标识集分割为多个子集,接收样本标识所对应的第一梯度值密文和第二梯度值密文;在子集内,将多个样本标识的第一梯度值密文同态相加,得到该子集的第一特征值密文,将多个样本标识的第二梯度值密文同态相加,得到该子集的第二特征值密文;利用随机数对第一特征值密文和第二特征值密文进行掩盖,得到掩盖后的第一特征值密文和掩盖后的第二特征值密文;向第二方发送子集所对应的掩盖后的第一特征值密文、以及掩盖后的第二特征值密文。本说明书的实施例,通过根据同态加密算法,利用随机数对特征值密文进行掩盖,可以增强在多方合作建模过程中数据的隐私保护。
-
公开(公告)号:CN111047051B
公开(公告)日:2023-03-31
申请号:CN201911323317.8
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 周亚顺
IPC: G06N20/00
Abstract: 本说明书实施例公开了一种机器学习模型的训练样本的筛选方法及其系统,包括:标签提供方对样本的标签值进行同态加密,以生成不同样本对应的标签值密文。特征提供方根据样本对应的数值区间特征值,将标签值密文与数值区间特征值进行对应,以生成数值区间特征值对应的特征密文。标签提供方对特征密文进行同态解密,以生成标签值与数值区间特征值的对应关系。特征提供方根据对应关系,对数值区间特征变量进行价值评估。特征提供方根据评估结果,对样本进行筛选。由此,特征提供方无法获知每个样本对应的标签值,标签提供方无法获知每个样本对应的数值区间特征值,从而防止泄露用户的隐私数据,保护了用户的数据信息安全。
-
公开(公告)号:CN110968886B
公开(公告)日:2022-12-02
申请号:CN201911322966.6
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 周亚顺
Abstract: 本说明书实施例公开了一种机器学习模型的训练样本的筛选方法及其系统,该方法包括:标签提供方对样本的标签值进行同态加密,以生成不同样本对应的标签值密文。特征提供方根据样本对应的类别型特征值,将标签值密文与类别型特征值进行对应,以生成类别型特征值对应的特征密文。标签提供方对特征密文进行同态解密,以生成标签值与类别型特征值的对应关系。特征提供方根据对应关系,对类别型特征变量进行价值评估。特征提供方根据评估结果,对样本进行筛选。由此,特征提供方无法获知每个样本对应的标签值,标签提供方无法获知每个样本对应的类别型特征值,从而防止泄露用户的隐私数据,保护了用户的数据信息安全。
-
公开(公告)号:CN113094739B
公开(公告)日:2022-04-22
申请号:CN202110243206.7
申请日:2021-03-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书提供了基于隐私保护的数据处理方法、装置和服务器。第一服务器和第二服务器在合作确定关于第一目标数据和第二目标数据乘积的秘密的分片数据时,第一服务器根据预设的秘密分享乘法协议,利用与第一目标数据对应的第一目标向量和所接收的第一随机向量,确定出编号差值,并将编号差值发送给第二服务器;第二服务器根据预设的秘密分享乘法协议,利用所持有的第二目标数据,和所接收的第二随机向量、编号差值,确定出差值向量,并将差值向量发送给第一服务器;第一服务器根据差值向量确定出秘密的第一分片数据,第二服务器根据第二随机数确定出秘密的第二分片数据,从而可以在保护数据隐私的前提下,高效地确定出秘密的分片数据。
-
公开(公告)号:CN114239087A
公开(公告)日:2022-03-25
申请号:CN202111520799.3
申请日:2021-12-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/72
Abstract: 本说明书实施例提供一种基于混淆电路的布尔电路连续执行方法及装置,在多方安全计算的业务处理过程中,基于混淆电路将业务处理过程拆分为多个算子电路的连续执行过程。在业务执行过程开始之前,可以预先存储大量混淆表数据。其中,在靠前电路的输出线作为靠后电路的输入线的情况下,由混淆方确定靠前电路输出线对应的备选标签和靠后电路输入线的备选标签之间的关联关系,并由靠前电路根据执行结果中的输出标签及该关联关系确定靠后电路的输入线对应的输入标签。这样,可以使得计算方对各个算子电路的执行能够连续执行,减少冗余通信,提高业务处理效率。
-
公开(公告)号:CN113868717A
公开(公告)日:2021-12-31
申请号:CN202111165292.0
申请日:2021-09-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种实现两方安全比较的布尔电路,用于确定第一方的第一数据是否小于第二方的第二数据的数据比较结果;第一数据和第二数据均为二进制数;布尔电路包括:比较单元,用于从二进制数的低位到高位,针对各当前位分别执行比较处理;比较处理包括:利用单个与门,根据第一数据的当前位、第二数据的当前位和上一位对应的中间比较结果,确定当前位的中间比较结果,其指示第一当前数据是否小于第二当前数据,第一当前数据为第一数据的最低位到当前位构成的数据,第二当前数据为第二数据的最低位到当前位构成的数据;结果确定单元,用于根据针对最高位进行比较处理之后的中间比较结果,确定数据比较结果。能够达到最小通信代价。
-
公开(公告)号:CN113033824A
公开(公告)日:2021-06-25
申请号:CN202110428875.1
申请日:2021-04-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例提供用于确定机器学习模型的超参数的方法及装置。在该方法中,第一成员设备将机器学习模型的当前超参数分发给各个第二成员设备。各个第二成员设备使用各自的训练样本集以及机器学习模型的当前超参数来按照隐私保护方式训练出机器学习模型。各个第二成员设备使用各自的测试样本集评估所训练出的机器学习模型的模型指标。在未满足循环结束条件时,经由第一成员设备确定下一循环过程的当前超参数来循环执行上述过程,并且每次循环过程的超参数与所确定的模型指标对应地存储在超参数数据库中。在满足循环结束条件时,第一成员设备将超参数数据库中模型指标最好的超参数确定为机器学习模型的超参数。
-
公开(公告)号:CN113011459A
公开(公告)日:2021-06-22
申请号:CN202110189061.7
申请日:2021-02-19
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
IPC: G06K9/62 , G06N3/08 , G06N20/00 , H04L12/801
Abstract: 本说明书实施例公开了一种模型训练方法、装置和计算设备。所述方法包括:第一方根据特定随机种子生成第一随机数集和第二随机数集,所述特定随机种子为第一方与随机数服务器之间协商的随机种子;随机数服务器根据特定随机种子生成第一随机数集和第二随机数集;根据第一随机数集和第二随机数集生成第三随机数集和第四随机数集;向第二方发送第三随机数集和第四随机数集;第二方接收第三随机数集和第四随机数集,以使第一方根据第一随机数集和第二随机数集,第二方根据第三随机数集和第四随机数集,联合训练模型。所述实施例可以减少传输的数据量。
-
-
-
-
-
-
-
-
-