保护隐私的机器学习模型训练方法及装置

    公开(公告)号:CN119558425A

    公开(公告)日:2025-03-04

    申请号:CN202411547313.9

    申请日:2024-10-31

    Abstract: 本说明书一个或多个实施例提供一种保护隐私的机器学习模型训练方法及装置。该方法包括:将原始样本输入底部模型得到第一类中间特征;将第一类中间特征输入特征保护网络,以对第一类中间特征进行变换,得到变换特征;将变换特征输入已训练的逆向模型,以通过逆向模型对变换特征进行还原,得到逆向模型输出的逆向样本;基于逆向样本和原始样本计算中间特征变换带来的样本损失,并以增大样本损失为目标更新特征保护网络;将变换特征发送至服务器端,以供服务器端将变换特征输入顶部模型得到原始样本的预测标签;接收服务器端发送的底部梯度,并基于底部梯度更新底部模型,底部梯度由服务器端基于预测标签和原始样本的样本标签计算得到。

    基于多轮对话来进行知识问答的方法及装置

    公开(公告)号:CN111966809B

    公开(公告)日:2024-07-16

    申请号:CN202010847695.2

    申请日:2020-08-21

    Inventor: 苏豫陇 王磊

    Abstract: 本说明书实施例提供了一种基于多轮对话来进行知识问答的方法及装置。在该方法中,获取用户的问题,根据问题确定用户的抽象用户意图和抽象用户意图对应的槽位组;在槽位组中存在缺少槽位信息的待补充槽位时,发起与用户的多轮对话,以确定待补充槽位的槽位信息;基于槽位组中的各个槽位的槽位信息确定具体用户意图;根据具体用户意图从知识库中获取对应的答案,以及将答案提供给用户。

    多方联合进行模型处理的方法及装置

    公开(公告)号:CN118297141A

    公开(公告)日:2024-07-05

    申请号:CN202410495822.5

    申请日:2024-04-23

    Abstract: 本说明书实施例中提供了一种多方联合进行模型处理的方法及装置,其中目标模型至少包括第一网络部分以及其后接续的第二网络部分,第一网络部分部署在第一参与方,第二网络部分部署在第二参与方,由第二参与方实施的方法包括:从第一参与方接收第一隐藏状态,第一隐藏状态是通过第一网络部分处理目标数据的目标输入特征而得到的;将第一隐藏状态输入第二网络部分,使第二网络部分中的目标网络层输出第二隐藏状态;通过解码器模型处理第二隐藏状态,获得用于拟合目标输入特征的目标拟合特征;对目标拟合特征和第二隐藏状态进行合并处理,获得第三隐藏状态;将第三隐藏状态输入目标网络层的下一网络层,使目标模型输出与目标数据对应的预测结果。

    一种多方参与的在线预测方法、系统和装置

    公开(公告)号:CN116910546A

    公开(公告)日:2023-10-20

    申请号:CN202310849205.6

    申请日:2023-07-11

    Inventor: 郑龙飞 王磊

    Abstract: 一种多方参与的在线预测方法、系统和装置,该方法包括:第一方将第一特征输入第一特征提取网络,对输出结果进行同态加密,得到第一加密向量并发送到第二方;第二方将第二特征输入第二特征提取网络,对输出结果进行同态加密得到第二加密向量,对第一和第二加密向量进行同态计算得到目标向量;构建包括目标向量和n‑1个混淆向量的向量集合并发送给第一方,记录目标向量在向量集合中的排列位置;第一方将向量集合中各加密向量解密后输入分类网络的第一部分得到n个分类向量,对n个分类向量进行同态加密后发送给第二方;第二方根据排列位置、分类网络的第二部分,确定出加密预测结果并发送给第一方;第一方对加密预测结果进行解密,得到明文预测结果。

    保护隐私的意图理解模型的训练方法及装置

    公开(公告)号:CN116705008A

    公开(公告)日:2023-09-05

    申请号:CN202310852162.7

    申请日:2023-07-11

    Inventor: 黄炜 王莹桂 王磊

    Abstract: 本说明书实施例披露一种保护隐私的意图理解模型的训练方法,其中意图理解模型包括语音编码器和第一解码器。该方法中任一轮次迭代训练包括:对于当前批次语音样本中任一语音样本,利用语音编码器和多个解码器中与该样本的标签所属任务类型对应的解码器处理该样本,得到语音预测结果,该多个解码器包括第一解码器和用于执行若干隐私任务的若干第二解码器;以减小各个语音预测结果和对应的语音样本标签之间的差距为目标,对语音编码器和多个解码器进行第一训练;再以增大各种隐私任务对应的语音预测结果和语音样本标签之间的差距,以及减小第一解码器输出的语音预测结果和语音样本标签之间的差距为目标,对经过第一训练的意图理解模型进行第二训练。

    用于训练图像识别模型的方法及装置

    公开(公告)号:CN115497142A

    公开(公告)日:2022-12-20

    申请号:CN202211215646.2

    申请日:2022-09-30

    Inventor: 王莹桂 王力 王磊

    Abstract: 本说明书的实施例提供用于训练图像识别模型的方法及装置。在各个第一成员设备处,对训练样本图像数据进行基于频域变换的数据脱敏处理以得到第一脱敏图像数据;将第一脱敏图像数据提供给超参数选择模型来选择第一超参数;使用第一超参数对第一脱敏图像数据进行基于数据增强的图像混合处理,以得到第二脱敏图像数据以及经过标签混合处理的标记标签数据。然后,使用第二脱敏图像数据以及对应的经过标签混合处理后的标记标签数据训练图像识别模型。第二成员设备使用从各个第一成员设备接收的模型训练结果来更新图像识别模型。

    图像数据的处理和识别、图像识别模型训练的方法及装置

    公开(公告)号:CN115497141A

    公开(公告)日:2022-12-20

    申请号:CN202211215209.0

    申请日:2022-09-30

    Inventor: 王莹桂 王力 王磊

    Abstract: 本说明书的实施例提供图像数据的处理和识别、图像识别模型训练的方法及装置。在进行图像数据处理时,对图像数据进行基于频域变换的数据脱敏处理,以得到图像数据的脱敏图像数据,所得到的脱敏图像数据包括子图数据集合,子图数据集合中的每个子图数据对应不同频率。随后,对所得到的脱敏图像数据进行基于数据增强的图像混合处理,以得到经过数据增强后的脱敏图像数据。可选地,对经过数据增强后的脱敏图像数据中的每个子图数据进行图大小对齐处理,以使得经过图大小对齐处理后的每个子图数据的大小与原始图像数据的大小相同。

    针对逻辑回归模型进行联合训练的方法及装置

    公开(公告)号:CN115048674A

    公开(公告)日:2022-09-13

    申请号:CN202210744765.0

    申请日:2022-06-28

    Inventor: 刘颖婷 王力 王磊

    Abstract: 本说明书实施例提供一种多方联合针对逻辑回归模型进行联合训练的方法及装置,在多方联合利用各自的隐私数据进行逻辑回归模型训练过程中,利用多项式、分段函数等对逻辑斯蒂函数进行近似计算,以减少逻辑斯蒂函数计算的复杂度。具体地,针对训练数据的特点,结合各个数据持有方所持有的隐私数据的实际情况,确定对逻辑斯蒂函数近似计算的不同精度需求,从而选择逻辑回归模型中针对逻辑斯蒂函数的近似方案。该方式可以兼顾多方安全计算的逻辑回归模型准确性和效率需求,提高多方安全计算场景下联合训练逻辑回归模型的有效性。

    用于保护隐私的数据处理方法、装置和计算机设备

    公开(公告)号:CN114978484A

    公开(公告)日:2022-08-30

    申请号:CN202210394145.9

    申请日:2022-04-15

    Abstract: 本说明书实施例公开了一种用于保护隐私的数据处理方法、装置和计算机设备。所述方法包括:将隐私数据编码到第一多项式函数的系数中;获取第一多项式函数的多个函数值,作为隐私数据拆分后的多个分片,其中,隐私数据的分片用于采用秘密分享算法进行计算,以获得目标数据分片。本说明书实施例的技术方案,利用第一多项式函数对隐私数据进行了拆分。另外,还可以在本地对多个隐私数据的分片进行计算,得到目标数据的分片,无需借助于第三方,提高了秘密分享算法的计算效率。另外,还利用第二多项式函数恢复了目标数据。

Patent Agency Ranking