一种隐私保护的模型训练方法和系统

    公开(公告)号:CN113011587A

    公开(公告)日:2021-06-22

    申请号:CN202110313679.X

    申请日:2021-03-24

    Abstract: 本说明书涉及机器学习领域,特别涉及一种隐私保护的模型训练方法和系统。该方法包括,基于训练样本和模型的第一部分,得到初始输出矩阵;对所述初始输出矩阵添加扰动噪声,并进行稀疏化,得到扰动输出矩阵;将扰动输出矩阵传输给所述服务器,以便服务器利用模型的第二部分处理所述扰动输出矩阵得到模型预测结果;基于标签数据以及所述预测结果确定损失函数值;将损失函数值传输给服务器,接收服务器返回的输出梯度矩阵;基于输出梯度矩阵计算出模型的第一部分中各模型参数对应的梯度信息;基于所述梯度信息更新模型的第一部分的模型参数;进行下一轮迭代更新,或者基于此确定最终模型的第一部分。

    基于数据隐私保护的两方数据聚类方法、装置及系统

    公开(公告)号:CN111737753B

    公开(公告)日:2020-12-22

    申请号:CN202010722393.2

    申请日:2020-07-24

    Abstract: 本说明书实施例提供基于数据隐私保护的两方数据聚类方法、装置及系统。在各个数据拥有方处,分别将各自具有的数据集中的各个数据样本切分为两个数据份额。各个数据拥有方将所切分出的各个数据样本的两个数据份额中的一个数据份额共享给另一数据拥有方。在各个数据拥有方处,分别基于该数据拥有方保留的各个数据样本的数据份额以及从另一数据拥有方获取的各个数据样本的数据份额得到该数据拥有方的重组数据集。在各个数据拥有方之间,使用各个数据拥有方的重组数据集来进行数据聚类。

    一种用于分布式模型训练的目标数据方筛选方法及系统

    公开(公告)号:CN111931876A

    公开(公告)日:2020-11-13

    申请号:CN202011082434.2

    申请日:2020-10-12

    Abstract: 本说明书一个或多个实施例涉及一种用于分布式模型训练的目标数据方筛选方法和系统,所述方法包括:从任务方获取训练任务信息;所述训练任务信息包括待预训练模型信息以及待训练目标模型信息;接收来自至少一个数据方的接受任务指示,得到备选数据方集合;将所述待预训练模型信息下发给所述备选数据方集合中的各数据方;获取所述各数据方的预训练模型;其中,所述各数据方的预训练模型是基于自身持有的训练样本以及所述待预训练模型信息进行模型训练得到的;获取各预训练模型的性能指标参数;至少基于各预训练模型的性能指标参数,从备选数据方集合中确定一个或多个目标数据方;将所述待训练目标模型信息下发给各目标数据方。

    一种基于联邦学习的超参数确定方法及装置

    公开(公告)号:CN111915023A

    公开(公告)日:2020-11-10

    申请号:CN202010884802.9

    申请日:2020-08-28

    Abstract: 本说明书实施例提供一种基于联邦学习的超参数确定方法及装置。该方法用于确定业务预测模型的超参数,该业务预测模型的多个计算层被划分为包含连续后M个计算层的第一部分模型和包含剩余计算层的第二部分模型,第一部分模型部署在服务器中,第二部分模型部署在多个训练成员中。在任意一次超参迭代过程中,服务器将第一超参数组中的多个超参数向量分别发送至对应的训练成员,并与多个训练成员之间,多次执行针对业务预测模型的模型迭代过程,在多次模型迭代过程完成后,利用安全聚合算法,基于多个训练成员利用各自的测试集得到的业务预测模型的分立预测性能值,确定聚合预测性能值,基于聚合预测性能值,更新第一超参数组。

    图神经网络模型训练方法、装置及系统

    公开(公告)号:CN111738438A

    公开(公告)日:2020-10-02

    申请号:CN202010691847.4

    申请日:2020-07-17

    Abstract: 本说明书实施例提供图神经网络模型训练方法及装置。图神经网络模型包括位于各个第一成员设备的节点特征向量表示子模型和归一化子模型以及位于第二成员设备的判别模型,各个第一成员设备的私有数据是非独立同分布数据。各个第一成员设备的节点特征向量表示子模型的模型结构根据各自数据的数据分布特征确定。各个第一成员设备使用节点特征向量表示子模型和归一化子模型得到归一化特征向量表示,利用从第二成员设备获取的判别模型得到预测标签值并确定出损失函数。各个第一成员设备基于损失函数,确定判别模型的模型更新量并更新节点特征向量表示子模型和归一化子模型。第二成员设备使用源于各个第一成员设备的判别模型的模型更新量更新判别模型。

    训练人脸识别模型、图像注册、人脸识别方法和装置

    公开(公告)号:CN111680676A

    公开(公告)日:2020-09-18

    申请号:CN202010820143.2

    申请日:2020-08-14

    Abstract: 本说明书实施例提供一种训练人脸识别模型、图像注册、人脸识别方法和装置,用于防止隐私泄露。方法包括:终端设备将人脸训练图像输入第一子模型,得到初始隐层特征;利用第一公钥对初始隐层特征进行同态加密得到加密隐层特征;向服务器发送加密隐层特征和第一公钥;服务器基于加密隐层特征和第二子模型,得到第一加密输出特征;从服务器接收第一加密输出特征;利用第一私钥对第一加密输出特征解密,得到第一解密输出特征;向服务器发送第一解密输出特征,服务器根据第一解密输出特征和人脸训练图像的标签,更新第二子模型,确定反向传播到第一子模型的梯度;从服务器接收梯度,根据梯度更新第一子模型。能够提高人脸识别的安全性。

    模型训练、预测方法及其系统

    公开(公告)号:CN110929886A

    公开(公告)日:2020-03-27

    申请号:CN201911248776.4

    申请日:2019-12-06

    Abstract: 本说明书中的实施例提供了模型训练、预测方法及其系统。模型被划分成本地模型和中心节点模型,各训练节点训练相同结构的本地模型,中心节点训练中心节点模型。训练过程中,各训练节点将训练样本的特征值拆分以获得特征值分片,互相交换特征值分片,基于交换结果及本地模型的第一模型参数通过秘密共享算法计算本地模型的第一输出分片,将第一输出分片发送给中心节点。中心节点基于同一样本ID对应的各训练节点的第一输出分片计算第一输入,基于同一样本ID对应的第一输入和样本标签训练中心节点模型,向各训练节点反馈中心节点模型输入层的目标梯度。各训练节点基于目标梯度更新本地模型参数。如此,可以保护数据隐私。

    模型训练方法、装置、存储介质、服务器、终端及系统

    公开(公告)号:CN114943274B

    公开(公告)日:2024-07-19

    申请号:CN202210394839.2

    申请日:2022-04-15

    Abstract: 本说明书一个或者多个实施例公开了一种模型训练方法、装置、存储介质、服务器、终端及系统。根据各特征训练终端中第一模型输出的第一输出层数据,可以求得服务器中第二模型输出的第二输出层数据,那么根据标签训练终端基于第二输出层数据返回的真实损失函数,可以求得真实损失函数关于服务器中第二模型的第二输出层数据的第一梯度,进而基于第一梯度可以求得第二模型的第一模拟损失函数,那么就可以基于第一模拟损失函数对第二模型进行更新,也可以实现对第一模型进行更新。

    联合训练的方法及装置
    20.
    发明授权

    公开(公告)号:CN114925744B

    公开(公告)日:2024-07-02

    申请号:CN202210391540.1

    申请日:2022-04-14

    Abstract: 本公开披露了一种联合训练的方法及装置。所述联合训练包括多个训练成员,所述多个训练成员用于对神经网络模型进行训练,所述多个训练成员包括第一训练成员和第二训练成员,所述第一训练成员的本地样本数据不包含标签数据,所述第一训练成员的本地模型为所述神经网络模型的前N层,所述第二训练成员的本地样本数据包含标签数据,所述第二训练成员的本地模型为所述神经网络模型,所述方法应用于所述第二训练成员,所述方法包括:从所述第一训练成员接收第一训练结果,所述第一训练结果为所述第一训练成员的本地模型的训练结果;根据所述第二训练成员的本地样本数据和所述第一训练结果,对所述第二训练成员的本地模型进行训练。

Patent Agency Ranking