保护数据隐私的业务预测模型训练方法及装置

    公开(公告)号:CN113379042B

    公开(公告)日:2022-05-17

    申请号:CN202110835599.0

    申请日:2021-07-23

    Abstract: 本说明书实施例提供了一种保护数据隐私的业务预测模型训练方法及装置。在训练过程中,成员设备利用自身持有的对象特征数据,通过业务预测模型进行预测,利用预测结果确定用于更新模型参数的更新参量,其中包括针对业务预测模型的多个计算层的多个子参量;利用多个子参量,将多个计算层划分成第一类计算层和第二类计算层,第一类计算层的子参量值在指定范围以内;对第一类计算层的子参量进行隐私处理,并输出处理后子参量。多个成员设备的处理后子参量可以被聚合成聚合子参量。成员设备可以获取第一类计算层的聚合子参量,并利用聚合子参量和第二类计算层的子参量,对模型参数进行更新。

    一种隐私保护的模型训练方法和系统

    公开(公告)号:CN113011587B

    公开(公告)日:2022-05-10

    申请号:CN202110313679.X

    申请日:2021-03-24

    Abstract: 本说明书涉及机器学习领域,特别涉及一种隐私保护的模型训练方法和系统。该方法包括,基于训练样本和模型的第一部分,得到初始输出矩阵;对所述初始输出矩阵添加扰动噪声,并进行稀疏化,得到扰动输出矩阵;将扰动输出矩阵传输给所述服务器,以便服务器利用模型的第二部分处理所述扰动输出矩阵得到模型预测结果;基于标签数据以及所述预测结果确定损失函数值;将损失函数值传输给服务器,接收服务器返回的输出梯度矩阵;基于输出梯度矩阵计算出模型的第一部分中各模型参数对应的梯度信息;基于所述梯度信息更新模型的第一部分的模型参数;进行下一轮迭代更新,或者基于此确定最终模型的第一部分。

    一种数据脱敏方法和系统
    23.
    发明公开

    公开(公告)号:CN114357519A

    公开(公告)日:2022-04-15

    申请号:CN202210017820.6

    申请日:2022-01-07

    Abstract: 本说明书实施例提供了一种编码器训练方法、数据脱敏方法和系统,方法包括:通过编码器处理样本数据,得到样本编码数据;基于预设位置从样本编码数据中提取部分数据以确定样本数据对应的样本脱敏数据;通过至少一个任务处理模型分别处理其对应的样本脱敏数据,得到各任务处理模型对应的任务预测结果;通过数据重构模型处理样本编码数据,得到重构数据;至少调整编码器的模型参数,以使得各任务预测结果与对应的参考标准的差异减小,以及使得重构数据与样本数据的差异增大。还包括利用训练好的编码器处理原始数据,得到编码数据;基于预设位置从编码数据中提取部分数据;基于所述部分数据确定原始数据对应的脱敏数据。

    一种基于联邦学习进行模型参数更新的方法、系统及装置

    公开(公告)号:CN112990476B

    公开(公告)日:2022-04-12

    申请号:CN202110177803.4

    申请日:2021-02-08

    Abstract: 本说明书一个或多个实施例涉及一种基于联邦学习进行模型参数更新的方法,所述方法由参与方中的任一训练成员实现,包括:获取当前轮对应的待训练模型;基于自身持有的训练样本对所述待训练模型进行训练,获得当前轮对应的第一模型;将与所述第一模型上传给服务器,并获取当前轮下发的聚合模型;将来自一轮或多轮迭代更新的一个或多个聚合模型与来自一轮或多轮迭代更新的一个或多个第一模型通过杂交函数处理,获取多个子代模型;基于突变比例以及预设的突变函数对多个子代模型进行处理,获取突变后的多个子代模型;对突变后的多个子代模型进行性能评估,并筛选出性能最优的子代模型作为下一轮迭代的待训练模型或者基于此确定该训练成员的最终模型。

    查询处理方法及装置
    25.
    发明授权

    公开(公告)号:CN113553363B

    公开(公告)日:2021-12-14

    申请号:CN202111110468.2

    申请日:2021-09-23

    Inventor: 杜健 张本宇

    Abstract: 本说明书实施例提供一种查询处理方法及装置。该方法包括:首先,确定有待针对目标数据集进行查询的L条查询各自的查询类型,所述目标数据集记录业务对象的数据;接着,确定各个查询类型针对所述目标数据集的查询敏感度;然后,基于各条查询分别对应的查询敏感度,以及针对所述L条查询的总集预先设定的隐私预算参数,确定各条查询分配得到的噪声功率。据此,针对所述L条查询中任意的目标查询,可以将其实际返回结果确定为其原始查询结果叠加从差分隐私的目标噪声分布采样的目标噪声,其中目标噪声分布基于所述目标查询分配得到的噪声功率而确定。如此,可以实现对目标数据集的隐私保护。

    联合更新模型的方法、装置及系统

    公开(公告)号:CN113377797A

    公开(公告)日:2021-09-10

    申请号:CN202110753670.0

    申请日:2021-07-02

    Abstract: 本说明书实施例提供一种联合更新模型的方法、装置及系统,用于服务方与k个数据方联合更新模型的过程。其中,各个数据方分别利用本地训练样本更新模型对应的M个待同步参数并选择部分更新值以及当前同步周期使用的本地训练样本数量上传至服务方,服务方根据各个数据方上传的训练样本数量聚合各个待同步参数的更新值,得到各个聚合值构成的同步参数集Wt,并反馈给各个数据方,各个数据方利用同步参数集Wt,更新本地的待定参数,从而更新本地模型。这种实施方式可以提高模型精度,加快收敛速度。

    一种基于联邦学习进行模型参数更新的方法、系统及装置

    公开(公告)号:CN112288100B

    公开(公告)日:2021-08-03

    申请号:CN202011589914.8

    申请日:2020-12-29

    Abstract: 本说明书涉及一种基于联邦学习进行模型参数更新的方法、系统及装置,能够用于数据隐私保护。所述方法由参与方中的任一训练成员实现,所述方法包括对模型参数进行多轮迭代更新,其中一轮迭代更新包括:获取与其他参与方具有相同结构的待训练模型;基于自身持有的训练样本及样本标签进行对所述待训练模型进行训练,获得梯度矩阵;至少基于所述梯度矩阵以及第一超参数计算第一运算值矩阵;基于所述梯度矩阵计算第二运算值矩阵;将所述第一运算值矩阵和第二运算值矩阵上传给所述服务器,以便服务器更新服务器端的待训练模型的模型参数;从所述服务器获取更新后的模型参数以将其作为待训练模型进行下一轮迭代更新,或者基于此确定最终模型。

    图像处理、图像识别模型的训练、图像识别的方法和系统

    公开(公告)号:CN112966737A

    公开(公告)日:2021-06-15

    申请号:CN202110238513.6

    申请日:2021-03-04

    Abstract: 本说明书实施例公开了图像处理、图像识别模型的训练、图像识别的方法和系统。其中所述方法包括:获取待处理图像数据;对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:对所述多个特征图进行筛选,保留其中部分特征图;对筛选后的特征图进行损失处理;对经过损失处理后的特征图进行融合处理,以获取数量少于损失处理后的特征图的一个或多个融合特征图。

    图像处理、图像识别模型的训练、图像识别的方法和系统

    公开(公告)号:CN112257697A

    公开(公告)日:2021-01-22

    申请号:CN202011532933.7

    申请日:2020-12-23

    Abstract: 本说明书实施例公开了一种图像处理、图像识别模型的训练、图像识别的方法和系统。该方法包括:获取待处理图像数据;对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:对所述多个特征图进行筛选,保留其中部分特征图;基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理;以及,对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。

    同态加密操作方法、装置和电子设备

    公开(公告)号:CN114584284B

    公开(公告)日:2024-10-15

    申请号:CN202210397418.5

    申请日:2022-04-15

    Abstract: 本说明书实施例提出了一种同态加密操作方法、装置和电子设备,其中,上述同态加密操作方法中,确定对指定的业务数据所要执行的同态加密操作之后,获取上述同态加密操作包含的幂运算的底数参数和指数参数,然后根据上述指数参数,查询上述底数参数对应的幂运算结果缓存表,获取上述幂运算的结果,最后根据上述幂运算的结果,完成同态加密操作,从而可以实现通过幂运算结果缓存表,大大减少幂运算中乘法的计算次数,大幅度减少了幂运算需要的时间,进而可以提升同态加密的性能。

Patent Agency Ranking