-
公开(公告)号:CN112052942A
公开(公告)日:2020-12-08
申请号:CN202010986099.2
申请日:2020-09-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供神经网络模型训练方法及装置。神经网络模型包括位于各个第一成员设备的第一神经网络子模型。各个第一成员设备使用私有数据进行模型预测得到预测标签数据并确定第一神经网络子模型的模型更新信息,将第一神经网络子模型的模型更新信息和本地样本分布信息提供给第二成员设备。第二成员设备根据各个第一成员设备的第一神经网络子模型的模型更新信息进行神经网络模型重构,根据各个第一成员设备的本地样本分布信息确定整体样本概率分布,并将重构后的神经网络模型和整体样本概率分布分发给各个第一成员设备。各个第一成员设备根据本地样本概率分布、重构后的神经网络模型以及整体样本概率分布更新第一神经网络子模型。
-
公开(公告)号:CN111444545B
公开(公告)日:2020-09-04
申请号:CN202010536743.6
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对多方的隐私数据进行聚类的方法和装置,方法包括:第一方确定第一类簇集合中各个类簇当前分别对应的第一中心数据;第二方具有第二类簇集合中各个类簇当前分别对应的第二中心数据;第一类簇集合和第二类簇集合构成总类簇集合;计算第一隐私数据和各个第一中心数据之间的第一明文距离;基于同态加密的方式,与第二方联合计算第一隐私数据和各个第二中心数据之间的第一密文距离;对第一密文距离解密,得到第一隐私数据和第二中心数据之间的第二明文距离;根据各第一明文距离,以及各第二明文距离,选择最短明文距离对应的类簇作为第一隐私数据当前归属的类簇。能够防止泄露隐私数据。
-
公开(公告)号:CN111291165B
公开(公告)日:2020-08-14
申请号:CN202010384236.5
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供一种训练词向量嵌入模型的方法,该方法包括多次迭代更新,其中任一次包括:先从训练语句对应的词语序列中,确定中心词语和对应的多个上下文词语;接着,根据第一词向量矩阵,确定该中心词语对应的中心词向量,以及根据第二词向量矩阵,确定该多个上下文词语对应的多个上下文词向量;然后,基于该多个上下文词向量彼此之间的相似度,确定其对应的多个注意力权重;再利用该多个注意力权重,对该多个上下文词向量进行加权求和,得到中心词语的上下文表示向量;再然后,计算该中心词向量与该上下文表示向量之间的第一相似度;最后,至少以增大该第一相似度为目标,更新上述第一词向量矩阵和第二词向量矩阵。
-
公开(公告)号:CN111523686A
公开(公告)日:2020-08-11
申请号:CN202010326265.6
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。
-
公开(公告)号:CN111460510A
公开(公告)日:2020-07-28
申请号:CN202010302518.6
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护确定多个业务方的相同业务数据的方法,通过在各个业务方按照相同规则分别设置的4个哈希表,结合布谷鸟哈希,以及相同业务数据的散列值存储位置重合原理,使得两两业务方之间的数据比较次数大大减少,例如减少至8(子表数量)与业务数据较多的业务方所拥有的业务数据条数的乘积,提高比较效率,另一方面,采用基于秘密共享的等式比较方式进行相应位置的两方数据比较,并在数据比较过程中采用随机抽取部分位比较的方法,减少安全比较过程中的计算量,提高比较效率。总之,本说明书的技术构思可以在隐私保护的基础上,提高确定多个业务方的相同业务数据的效率。
-
公开(公告)号:CN111401479A
公开(公告)日:2020-07-10
申请号:CN202010307728.4
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多方联合对隐私数据进行降维处理的方法和装置,在隐私数据纵向分布的情况下,第一持有方针对第一原始矩阵进行零均值化得到第一中心矩阵,获取N*N维的非对称正交矩阵,将非对称正交矩阵与第一中心矩阵相乘得到第一隐秘矩阵,将第一隐秘矩阵发送至可信第三方。可信第三方对各个隐秘矩阵进行拼接得到全局隐秘矩阵,全局隐秘矩阵与其转置矩阵相乘得到协方差矩阵,对协方差矩阵进行本征值求解得到降维变换矩阵,对降维变换矩阵进行拆分后得到各个拆分矩阵,并发送至持有方。第一持有方用第一拆分矩阵处理第一原始矩阵得到第一降维矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。
-
公开(公告)号:CN111241570A
公开(公告)日:2020-06-05
申请号:CN202010329627.7
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中第一方和第二方分别拥有一部分特征数据,分别维护第一和第二参数部分。在模型迭代时,双方各自计算其特征矩阵与参数的乘积结果,第一方将其乘积结果同态加密后发送给拥有标签的第二方,由第二方进行同态运算,得到加密误差向量。然后,第二方对该加密误差向量添加混淆向量后发送给第一方,并与第一方各自采用该混淆向量和特征矩阵进行安全矩阵乘法,得到乘积分片。第二方可选的对乘积分片添加混淆,然后发给第一方。第一方由此确定出其第一梯度,据此更新其参数。
-
公开(公告)号:CN111045829B
公开(公告)日:2020-06-02
申请号:CN202010174985.5
申请日:2020-03-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种业务预测模型的划分处理及预测方法和装置。在对业务预测模型进行划分时,协调设备可以确定业务预测模型的N个计算层中每个计算层的运算对应的内存占用量;根据可信计算单元的内存容量以及内存占用量,确定分配至可信计算单元的连续的前M个计算层,并得到分配至非可信数据处理设备的N‑M个计算层。可信计算单元可以将业务数据输入前M个计算层中,并得到输出结果,通过预设安全协议将输出结果发送至非可信数据处理设备,非可信数据处理设备中的N‑M个计算层基于输出结果确定针对业务数据的预测结果。
-
公开(公告)号:CN111178549A
公开(公告)日:2020-05-19
申请号:CN202010276696.6
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中双方各自拥有一部分特征数据。在模型迭代过程中,双方通过安全矩阵乘法,得到总的特征矩阵X与总的参数矩阵W的乘积结果的两个乘积分片。拥有标签的第二方对标签向量Y进行秘密分享,使双方得到两个标签分片。于是,双方各自根据持有的乘积分片和标签分片计算出对应的误差分片。然后双方基于各自的误差分片和特征矩阵,通过秘密分享和安全矩阵乘法,得到对应的梯度分片。然后,第一方利用其梯度分片更新其维护的参数分片,第二方利用其梯度分片更新其维护的参数分片。如此实现保护数据隐私的安全联合训练。
-
公开(公告)号:CN111177576A
公开(公告)日:2020-05-19
申请号:CN202010276684.3
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06N5/00
Abstract: 本说明书实施例提供的一种依据决策内容生成决策树用于多方决策的方法和装置。在生成第一决策树时依据的第一决策内容包括:当业务对象的多个对象特征的特征值满足第一关系式时,针对该业务对象执行第一决策;其中,第一关系式由多个比较关系式及其之间的若干逻辑关系符构成,比较关系式由对象特征和阈值之间的比较关系构成。在生成第一决策树时,基于第一关系式中的每个比较关系式,生成对应的子决策树;确定若干逻辑关系符的类型及其之间的层次;根据各个逻辑关系符的类型以及层次,逐层地对各个比较关系式的子决策树进行拼接,得到第一关系式对应的第一决策树,该第一决策树用于根据对象特征的特征值确定是否针对该业务对象执行第一决策。
-
-
-
-
-
-
-
-
-