用于训练图像识别模型的方法及装置

    公开(公告)号:CN115497142A

    公开(公告)日:2022-12-20

    申请号:CN202211215646.2

    申请日:2022-09-30

    Inventor: 王莹桂 王力 王磊

    Abstract: 本说明书的实施例提供用于训练图像识别模型的方法及装置。在各个第一成员设备处,对训练样本图像数据进行基于频域变换的数据脱敏处理以得到第一脱敏图像数据;将第一脱敏图像数据提供给超参数选择模型来选择第一超参数;使用第一超参数对第一脱敏图像数据进行基于数据增强的图像混合处理,以得到第二脱敏图像数据以及经过标签混合处理的标记标签数据。然后,使用第二脱敏图像数据以及对应的经过标签混合处理后的标记标签数据训练图像识别模型。第二成员设备使用从各个第一成员设备接收的模型训练结果来更新图像识别模型。

    图像数据的处理和识别、图像识别模型训练的方法及装置

    公开(公告)号:CN115497141A

    公开(公告)日:2022-12-20

    申请号:CN202211215209.0

    申请日:2022-09-30

    Inventor: 王莹桂 王力 王磊

    Abstract: 本说明书的实施例提供图像数据的处理和识别、图像识别模型训练的方法及装置。在进行图像数据处理时,对图像数据进行基于频域变换的数据脱敏处理,以得到图像数据的脱敏图像数据,所得到的脱敏图像数据包括子图数据集合,子图数据集合中的每个子图数据对应不同频率。随后,对所得到的脱敏图像数据进行基于数据增强的图像混合处理,以得到经过数据增强后的脱敏图像数据。可选地,对经过数据增强后的脱敏图像数据中的每个子图数据进行图大小对齐处理,以使得经过图大小对齐处理后的每个子图数据的大小与原始图像数据的大小相同。

    针对逻辑回归模型进行联合训练的方法及装置

    公开(公告)号:CN115048674A

    公开(公告)日:2022-09-13

    申请号:CN202210744765.0

    申请日:2022-06-28

    Inventor: 刘颖婷 王力 王磊

    Abstract: 本说明书实施例提供一种多方联合针对逻辑回归模型进行联合训练的方法及装置,在多方联合利用各自的隐私数据进行逻辑回归模型训练过程中,利用多项式、分段函数等对逻辑斯蒂函数进行近似计算,以减少逻辑斯蒂函数计算的复杂度。具体地,针对训练数据的特点,结合各个数据持有方所持有的隐私数据的实际情况,确定对逻辑斯蒂函数近似计算的不同精度需求,从而选择逻辑回归模型中针对逻辑斯蒂函数的近似方案。该方式可以兼顾多方安全计算的逻辑回归模型准确性和效率需求,提高多方安全计算场景下联合训练逻辑回归模型的有效性。

    一种基于因子分解机的推送模型优化、预测方法和装置

    公开(公告)号:CN110795631B

    公开(公告)日:2022-09-06

    申请号:CN201911039125.4

    申请日:2019-10-29

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供了一种由用户终端执行的推送模型的优化方法和装置以及基于其的预测方法和装置,所述优化方法包括:获取第一用户针对第一对象的第一行为数据;从服务器接收所述第一对象的当前特征数据和当前的特征交叉模型;基于第一行为数据、第一用户的当前特征数据、第一对象的当前特征数据、当前的线性模型、以及当前的特征交叉模型,计算用于优化线性模型的第一梯度数据;确定所述第一用户的当前的预定数目的邻居用户;将所述第一梯度数据分别发送给所述预定数目的邻居用户各自的终端,以使得每个邻居用户的终端基于所述第一梯度数据分别优化其本地的线性模型,该方法通过多方安全计算保护各个终端的用户隐私不泄露给服务器端。

    基于差分隐私的待共享数据处理方法、装置、设备和介质

    公开(公告)号:CN114912140A

    公开(公告)日:2022-08-16

    申请号:CN202210399998.1

    申请日:2022-04-15

    Abstract: 本说明书实施例公开了一种基于差分隐私的待共享数据处理方法、装置、设备和介质。方案可以包括:获取原始数据矩阵;所述原始数据矩阵包含待共享的数据;所述待共享的数据中包含隐私信息;对所述原始数据矩阵进行奇异值分解,得到左奇异矩阵、对角矩阵和右奇异矩阵;基于预设的扰动值,对所述对角矩阵进行扰动,得到扰动后的对角矩阵;基于所述左奇异矩阵、所述扰动后的对角矩阵和所述右奇异矩阵,得到扰动后的数据矩阵;使用预设的高斯随机矩阵,对所述扰动后的数据矩阵进行随机变换,得到协方差矩阵;所述协方差矩阵用于发布所述待共享的数据。

    一种多方联合训练中的数据同步方法及装置

    公开(公告)号:CN114861217A

    公开(公告)日:2022-08-05

    申请号:CN202210302973.5

    申请日:2022-03-25

    Abstract: 本说明书实施例提供了一种多方联合训练中的数据同步方法及装置。其中,服务器对参与方设备共有的样本标识进行打乱顺序和采样,并将得到的第一样本标识序列发送至参与方设备,过程中不会泄露参与方的数据隐私。任意一个参与方设备从自身样本中获取按照第一样本标识序列排列的多个样本,并针对得到的训练集中的多个样本,按照既有排列顺序进行分批,得到多个分批样本和对应的分批次序,在需要进行模型联合训练时,确定本次模型训练的训练次序,基于训练次序确定对应的分批次序和分批样本,基于分批样本确定自身模型的输出结果。多个参与方设备基于训练次序和对应的输出结果进行数据交互和数据同步,以对各自的模型进行更新。

    一种个性化的隐私保护学习方法、装置以及设备

    公开(公告)号:CN112836829B

    公开(公告)日:2022-08-02

    申请号:CN202110104747.1

    申请日:2021-01-26

    Inventor: 陈超超 王力

    Abstract: 本说明书实施例公开了一种个性化的隐私保护学习方法、装置以及设备。方案应用于第一参与端,包括:确定全局模型和第一参与端的局部模型;通过与多个第二参与端进行联邦学习,协同训练全局模型;根据协同训练后的全局模型,在多个第二参与端中选择第二参与端;与选择出的第二参与端协同训练第一参与端的局部模型。

    基于联邦学习的模型梯度确认方法、装置、设备及介质

    公开(公告)号:CN114819183A

    公开(公告)日:2022-07-29

    申请号:CN202210399999.6

    申请日:2022-04-15

    Inventor: 史专 王力

    Abstract: 本说明书实施例公开了一种基于联邦学习的模型梯度确定方法、装置、设备及介质。方案包括:获取参与节点的数据体量信息;所述数据体量信息用于表示所述参与节点基于本地数据对基础训练模型进行训练时采用的数据量;获取所述参与节点基于本地数据对所述基础训练模型进行训练得到的节点局部梯度;根据所述数据体量信息,以及所述节点局部梯度,确定所述参与节点参与的联邦学习模型的全局梯度;基于所述参与节点的节点局部梯度,以及所述全局梯度,确定所述参与节点的参与度;基于所述参与度,确定所述参与节点的实际模型梯度。

    用于经由多个数据拥有方训练模型的方法、装置及系统

    公开(公告)号:CN114819182A

    公开(公告)日:2022-07-29

    申请号:CN202210397805.9

    申请日:2022-04-15

    Abstract: 本说明书实施例提供了用于经由多个数据拥有方训练模型的方法、装置及系统。在该方法中,各个第二数据拥有方根据第一数据确定出与各个第一数据相交的第二特征数据,执行下述主循环过程,直至满足第一循环结束条件:针对每个训练单元,利用第一训练样本和第二训练样本对参与该训练单元训练的第一模型、第二模型和第三模型进行协同训练,主服务器对各个训练单元的经过训练的第一模型和/或第三模型进行联邦聚合,以得到对应的第一全局模型和/或第三全局模型,在各个第一数据拥有方处和/或各个从服务器处,根据第一全局模型对第一模型进行更新和/或根据第三全局模型对第三模型进行更新。

    一种由用户终端执行的推送模型优化方法和装置

    公开(公告)号:CN113077058B

    公开(公告)日:2022-07-15

    申请号:CN202110460791.6

    申请日:2019-10-23

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供了一种由用户终端执行的推送模型优化方法,所述终端与第一用户相对应,所述终端本地包括当前的推送模型,所述推送模型基于矩阵分解方法进行预测,所述方法包括:从本地获取第一用户针对第一对象的评分;基于所述评分、所述第一用户的当前嵌入向量和所述第一对象的当前嵌入向量,计算用于优化所述第一对象的嵌入向量的第一梯度向量;确定所述第一用户的当前的预定数目的邻居用户;将所述第一梯度向量分别发送给所述预定数目的邻居用户各自的终端,以使得每个邻居用户的终端基于所述第一梯度向量分别优化其本地的第一对象的嵌入向量。

Patent Agency Ranking