基于数据隐私保护的机器学习模型特征筛选方法及装置

    公开(公告)号:CN111079939A

    公开(公告)日:2020-04-28

    申请号:CN201911194023.X

    申请日:2019-11-28

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供用于基于数据隐私保护的机器学习模型特征筛选的方法。机器学习模型具有模型特征集,并且机器学习模型的特征数据被水平切分地分布在第一数据拥有方和至少一个第二数据拥有方处,每个数据拥有方具有与模型特征集对应的特征数据。第一数据拥有方和至少一个第二数据拥有方协同来使用第一数据拥有方的特征数据进行多方安全计算,以训练出待筛选模型特征的预测模型。在第一数据拥有方处,基于待筛选模型特征的预测差值确定待筛选模型特征的方差膨胀因子,以用于对待筛选模型特征进行模型特征筛选处理。

    逻辑回归模型训练方法、装置及系统

    公开(公告)号:CN110929887A

    公开(公告)日:2020-03-27

    申请号:CN202010096283.X

    申请日:2020-02-17

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供用于经由多个训练参与方来训练逻辑回归模型的方法和装置。在该方法中,逻辑回归模型被垂直切分为多个子模型,每个训练参与方具有一个子模型以及经过垂直切分后得到的特征数据子集。在训练时,第一训练参与方将标记值分解为多个部分标记值,并分别向各个第二训练参与方发送一个部分标记值。在各个训练参与方处,基于各自的当前子模型、特征数据子集以及部分标记值,确定该训练参与方处的预测差值。基于各个训练参与方的预测差值确定总预测差值。然后,各个训练参与方基于总预测差值和各自的特征数据子集,确定出对应的模型更新量并进行子模型更新。利用该方法,能够保证各个模型训练参与方处的私有数据的数据安全。

    一种基于树模型的预测方法和装置

    公开(公告)号:CN110795603A

    公开(公告)日:2020-02-14

    申请号:CN201911040223.X

    申请日:2019-10-29

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供了一种保护隐私的树模型构建方法和装置及基于该树模型的预测方法和装置,所述构建方法包括:从至少两个数据方各自的设备获取M组分裂结果,M组分裂结果与M个特征分别对应;记录M组分裂结果各自对应的数据方;基于N个样本各自的标签值,分别计算各个分裂结果的分裂增益;获取具有最大分裂增益的分裂结果作为最优分裂结果;在最优分裂结果的分裂增益为正值的情况中,确定最优分裂结果对应的数据方;在对应的数据方为第二数据方的情况中,将最优分裂结果发送给第二数据方的设备,并记录第一节点与第二数据方的对应关系;对第一节点进行标注,以指示本地没有第一节点的节点数据,并相应地更新所述第一树的树结构。

    用于为用户生成推荐的方法和系统

    公开(公告)号:CN110781389A

    公开(公告)日:2020-02-11

    申请号:CN201910994809.3

    申请日:2019-10-18

    Inventor: 陈超超 周俊

    Abstract: 本申请涉及一种用于为用户生成推荐的方法,所述方法包括:生成推荐模型,所述推荐模型用于为用户推荐物品;生成多视图社交模型,所述多视图社交模型对应于多个社交关系类型;组合所述推荐模型与所述多视图社交模型以得到多视图社交推荐模型;训练所述多视图社交推荐模型;以及使用经训练的多视图社交推荐模型来为所述用户生成推荐。本申请还公开了相关的系统和计算机存储介质。本申请能够更好地为用户生成推荐。

    一种由用户终端执行的推送模型优化方法和装置

    公开(公告)号:CN110704754A

    公开(公告)日:2020-01-17

    申请号:CN201910996134.6

    申请日:2019-10-18

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供一种由用户终端执行的推送模型优化方法和装置,所述终端与第一用户相对应,所述终端本地包括当前推送模型,所述方法包括:获取第一用户针对第一对象的第一行为数据,其中,第一对象属于预定候选推送对象集合;基于第一输入特征和第一行为数据,计算用于优化所述推送模型的第一梯度数据,其中,第一输入特征包括从本地获取的所述第一用户的当前特征和从服务器获取的第一对象的当前特征;确定第一用户的当前的预定数目的邻居用户,其中,邻居用户与所述第一用户具有预定关联关系;将第一梯度数据分别发送给预定数目的邻居用户各自的终端,以使得每个邻居用户的终端基于第一梯度数据分别优化其本地的推送模型。

    联合更新模型的方法、装置及系统

    公开(公告)号:CN114004363B

    公开(公告)日:2024-05-31

    申请号:CN202111256451.8

    申请日:2021-10-27

    Abstract: 本说明书实施例提供一种联合更新模型的方法、装置及系统。通过本说明书实施例提供的方法、装置和系统,基于联合更新模型时的数据复合切分情形,设想将训练成员的数据进行分割,从而构成多个水平切分的子系统,在单个子系统内部,可以包括数据垂直切分的训练成员。这样,数据呈垂直切分的单个子系统通过分布在多个训练成员的训练样本在子系统内部迭代,从而更新待同步参数。而各个子系统之间,可以按照同步条件触发的同步周期进行数据同步。这种方式充分考虑各个训练成员的数据构成,为复杂数据结构下的联合更新模型提供解决方案,有利于扩展联邦学习的应用范围。

    多方联合对隐私数据进行显著性检验的方法和装置

    公开(公告)号:CN111506922B

    公开(公告)日:2023-03-10

    申请号:CN202010307722.7

    申请日:2020-04-17

    Abstract: 本说明书实施例提供一种多方联合对隐私数据进行显著性检验的方法和装置,隐私数据分布在M个持有方中,M个持有方各自的原始矩阵能假定构成联合矩阵,联合矩阵对应于N个业务对象针对D项属性项的属性值构成的矩阵,检验方在获取到N个业务对象对应的N个预测值以及D项属性项对应的D个模型参数时,将对N个预测值的预定计算结果作为对角元素构建N*N维的预测值矩阵,利用秘密共享的矩阵乘法SMM,基于预测值矩阵以及M个持有方各自的原始矩阵进行乘操作,得到多个子矩阵,并构建中间矩阵,将中间矩阵的逆矩阵确定为预测值矩阵与联合矩阵形成的D*D维的方差协方差矩阵;基于方差协方差矩阵的对角元素,采用显著性检验法,确定属性项的显著性水平值。

    一种基于因子分解机的推送模型优化、预测方法和装置

    公开(公告)号:CN110795631B

    公开(公告)日:2022-09-06

    申请号:CN201911039125.4

    申请日:2019-10-29

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供了一种由用户终端执行的推送模型的优化方法和装置以及基于其的预测方法和装置,所述优化方法包括:获取第一用户针对第一对象的第一行为数据;从服务器接收所述第一对象的当前特征数据和当前的特征交叉模型;基于第一行为数据、第一用户的当前特征数据、第一对象的当前特征数据、当前的线性模型、以及当前的特征交叉模型,计算用于优化线性模型的第一梯度数据;确定所述第一用户的当前的预定数目的邻居用户;将所述第一梯度数据分别发送给所述预定数目的邻居用户各自的终端,以使得每个邻居用户的终端基于所述第一梯度数据分别优化其本地的线性模型,该方法通过多方安全计算保护各个终端的用户隐私不泄露给服务器端。

    一种个性化的隐私保护学习方法、装置以及设备

    公开(公告)号:CN112836829B

    公开(公告)日:2022-08-02

    申请号:CN202110104747.1

    申请日:2021-01-26

    Inventor: 陈超超 王力

    Abstract: 本说明书实施例公开了一种个性化的隐私保护学习方法、装置以及设备。方案应用于第一参与端,包括:确定全局模型和第一参与端的局部模型;通过与多个第二参与端进行联邦学习,协同训练全局模型;根据协同训练后的全局模型,在多个第二参与端中选择第二参与端;与选择出的第二参与端协同训练第一参与端的局部模型。

Patent Agency Ranking