模型超参数确定方法、模型训练方法及系统

    公开(公告)号:CN113033824B

    公开(公告)日:2023-04-07

    申请号:CN202110428875.1

    申请日:2021-04-21

    Abstract: 本说明书的实施例提供用于确定机器学习模型的超参数的方法及装置。在该方法中,第一成员设备将机器学习模型的当前超参数分发给各个第二成员设备。各个第二成员设备使用各自的训练样本集以及机器学习模型的当前超参数来按照隐私保护方式训练出机器学习模型。各个第二成员设备使用各自的测试样本集评估所训练出的机器学习模型的模型指标。在未满足循环结束条件时,经由第一成员设备确定下一循环过程的当前超参数来循环执行上述过程,并且每次循环过程的超参数与所确定的模型指标对应地存储在超参数数据库中。在满足循环结束条件时,第一成员设备将超参数数据库中模型指标最好的超参数确定为机器学习模型的超参数。

    模型的训练方法、装置和服务器

    公开(公告)号:CN113255928B

    公开(公告)日:2022-07-05

    申请号:CN202110472698.7

    申请日:2021-04-29

    Abstract: 本说明书提供了模型的训练方法、装置和服务器。在一些实施例中,在合作联合训练目标模型的过程中,进行当前轮当前批的数据处理时,可以先检测当前轮当前批的数据处理是否满足预设的触发条件;在确定满足预设的触发条件时,根据预设协议,第三数据方不需要生成新的随机矩阵,而是利用本地存储的随机矩阵集中的已有矩阵,来生成第一随机向量、第二随机向量和第三随机向量,并进行分发;第二数据方可以利用本地存储的中间矩阵集,计算得到处理结果秘密的第二分片;第一数据方不需要再另外生成并向第二数据方发送中间矩阵,而是利用本地存储的随机矩阵集,计算得到处理结果秘密的第一分片。从而可以减少模型训练时所涉及的数据计算量和数据传输量。

    基于隐私保护的数据处理方法、装置和服务器

    公开(公告)号:CN112800466B

    公开(公告)日:2022-04-22

    申请号:CN202110183313.5

    申请日:2021-02-10

    Abstract: 本说明书提供了基于隐私保护的数据处理方法、装置和服务器。针对分开持有特征数据和标签数据,且一方所持有的标签数据包含多种标签的复杂场景,第一服务器和第二服务器可以先基于秘密分享算法各自计算得到乘积秘密的第一分片矩阵和第二分片矩阵,并分别将上述分片矩阵发送至第三服务器;第三服务器先合并分片矩阵得到乘积秘密的明文数据矩阵,再根据预设的处理规则,对乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,并将从中间结果数据矩阵拆分出的分片矩阵分别提供给第一服务器和第二服务器。从而可以适用标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵。

    基于混淆电路的布尔电路连续执行方法及装置

    公开(公告)号:CN114239088A

    公开(公告)日:2022-03-25

    申请号:CN202111520800.2

    申请日:2021-12-13

    Abstract: 本说明书实施例提供一种基于混淆电路的布尔电路连续执行方法及装置,在多方安全计算的业务处理过程中,基于混淆电路将业务处理过程拆分为多个算子电路的连续执行过程。在业务执行过程开始之前,可以预先存储大量混淆表数据。其中,在靠前电路的输出线作为靠后电路的输入线的情况下,将靠前电路的相应输出标签与靠后电路的相应输入标签设为一致,并将靠前电路的混淆表与靠后电路的混淆表关联存储。这样,可以使得计算方对各个算子电路的执行能够连续执行,减少冗余通信,提高业务处理效率。

    乘法执行方法、数据准备方法及装置

    公开(公告)号:CN114089948A

    公开(公告)日:2022-02-25

    申请号:CN202111408064.1

    申请日:2021-11-24

    Abstract: 本说明书实施例中提供了一种基于SMPC的乘法执行方法、数据准备方法及装置。乘法执行方法包括:第一方根据执行轮次i,获取第一随机乘数和第一加法分片,第一随机乘数由第一随机数生成器基于执行轮次i生成,第一加法分片由第三方基于该第一随机乘数、第二随机乘数和第二加法分片计算得到,第二随机乘数和第二加法分片由部署在第三方的第二随机数生成器基于执行轮次i生成;第一方向第二方发送执行轮次i;第二方根据该执行轮次i,获取其部署的第二随机数生成器基于执行轮次i生成的第二随机乘数和第二加法分片;第一方利用第一随机乘数和第一加法分片,第二方利用第二随机乘数和第二加法分片,联合执行基于SMPC的第i次乘法。

    数据对象的聚类方法、装置和服务器

    公开(公告)号:CN113657451A

    公开(公告)日:2021-11-16

    申请号:CN202110817153.5

    申请日:2021-07-20

    Inventor: 周亚顺 尹栋 孙勇

    Abstract: 本说明书提供了数据对象的聚类方法、装置和服务器。持有数据对象的第一类特征数据的第一数据方,和持有数据对象的第二类特征数据的第二数据方在合作对数据对象进行聚类时,可以先根据预设的协议规则,分别利用各自所持有的数据进行第一交互,以分别得到数据对象与第一中心对象的特征距离的一个分片;接着,双方根据预设的协议规则,分别利用各自所持有的特征距离的一个分片进行第二交互,以从第一数据对象中确定出各个数据对象的匹配中心对象;再将数据对象划分到匹配中心对象所对应的类群中,完成数据对象的一次聚类。从而可以使得第一数据方和第二数据方在不向对方泄露己方所持有的数据的前提下,合作完成数据对象的聚类,保护双方的数据隐私。

    具有前向安全的可验证可搜索加密方法、装置以及设备

    公开(公告)号:CN113282542A

    公开(公告)日:2021-08-20

    申请号:CN202110553780.2

    申请日:2021-05-20

    Inventor: 尹栋 赵原 周亚顺

    Abstract: 本说明书实施例公开了具有前向安全的可验证可搜索加密方法、装置以及设备。方案包括:对关键字进行不可逆转换处理,得到安全令牌;根据安全令牌、待更新的文件标识符,对本地对应的已有验证信息进行更新,得到已更新验证信息;根据安全令牌、已更新验证信息和已有验证信息,确定对应的已更新状态和上一状态;根据已更新状态和上一状态进行异或处理,生成加密待还原信息,并发送至服务器存储;在需要利用关键字搜索时,根据安全令牌,使服务器通过加密待还原信息和异或处理,迭代地向历史状态回溯,得到待验证的文件标识符合集;根据本地与关键字对应的已有验证信息,验证服务器返回的文件标识符合集是否为正确的搜索结果。

    基于隐私保护的数据处理方法、装置和服务器

    公开(公告)号:CN113094739A

    公开(公告)日:2021-07-09

    申请号:CN202110243206.7

    申请日:2021-03-05

    Abstract: 本说明书提供了基于隐私保护的数据处理方法、装置和服务器。第一服务器和第二服务器在合作确定关于第一目标数据和第二目标数据乘积的秘密的分片数据时,第一服务器根据预设的秘密分享乘法协议,利用与第一目标数据对应的第一目标向量和所接收的第一随机向量,确定出编号差值,并将编号差值发送给第二服务器;第二服务器根据预设的秘密分享乘法协议,利用所持有的第二目标数据,和所接收的第二随机向量、编号差值,确定出差值向量,并将差值向量发送给第一服务器;第一服务器根据差值向量确定出秘密的第一分片数据,第二服务器根据第二随机数确定出秘密的第二分片数据,从而可以在保护数据隐私的前提下,高效地确定出秘密的分片数据。

    基于隐私保护的数据处理方法、装置和服务器

    公开(公告)号:CN112100679B

    公开(公告)日:2021-03-02

    申请号:CN202011276388.X

    申请日:2020-11-16

    Abstract: 本说明书提供了基于隐私保护的数据处理方法、装置和服务器。基于该方法,持有多种特征数据的第二服务器在接收到包含有按照标识信息排列的数据标签的密文数据的第一标签列后,可以根据多种特征数据的数据值的排列顺序对第一标签列进行多种排列,得到对应多种特征数据的多个第二标签列;再基于上述多个第二标签列和预设的分箱规则,确定出对应多种特征数据的数据箱中的数据标签的密文数据的和,并反馈给第二服务器:第二服务器通过解密,得到并向第一服务器反馈相应的明文数据的和。进而第一服务器可以根据上述明文数据的和,计算出各种特征数据的信息值;并根据特征数据的信息值、特征数据之间的相关性系数,筛选出符合要求的特征数据。

    基于隐私保护的数据处理方法、装置和服务器

    公开(公告)号:CN112100643A

    公开(公告)日:2020-12-18

    申请号:CN202011278017.5

    申请日:2020-11-16

    Inventor: 周亚顺

    Abstract: 本说明书提供了基于隐私保护的数据处理方法、装置和服务器。基于该方法,第二服务器在接收到包含有按照标识信息排列的数据标签的密文数据的第一标签列后,可以先根据己方所拥有的按照特征数据的数据值排列的特征列,对第一标签列进行重新排列,得到按照特征数据的数据值排列的第二标签列,并将该第二标签列发送给第一服务器;再接收来自第一服务器基于上述第二标签列所反馈的数据箱分隔点的位置信息;进而可以根据上述分隔点的位置信息,对特征列上的特征数据进行数据分箱处理。从而可以在不泄露双方所各自拥有的数据信息、保护数据隐私的前提下,安全地完成符合目标要求的特征数据的数据分箱。

Patent Agency Ranking