-
公开(公告)号:CN113961967A
公开(公告)日:2022-01-21
申请号:CN202111517113.5
申请日:2021-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护联合训练自然语言处理NLP模型的方法,其中NLP模型包括位于第一方的编码网络和位于第二方的处理网络。根据该方法,第一方获取本地的目标训练语句后,将其输入编码网络,基于所述编码网络的编码输出,形成句子表征向量。然后,在句子表征向量上添加符合差分隐私的目标噪声,得到目标加噪表征。将该目标加噪表征发送至第二方,用于处理网络的训练。
-
公开(公告)号:CN113553363B
公开(公告)日:2021-12-14
申请号:CN202111110468.2
申请日:2021-09-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2458 , G06F21/62
Abstract: 本说明书实施例提供一种查询处理方法及装置。该方法包括:首先,确定有待针对目标数据集进行查询的L条查询各自的查询类型,所述目标数据集记录业务对象的数据;接着,确定各个查询类型针对所述目标数据集的查询敏感度;然后,基于各条查询分别对应的查询敏感度,以及针对所述L条查询的总集预先设定的隐私预算参数,确定各条查询分配得到的噪声功率。据此,针对所述L条查询中任意的目标查询,可以将其实际返回结果确定为其原始查询结果叠加从差分隐私的目标噪声分布采样的目标噪声,其中目标噪声分布基于所述目标查询分配得到的噪声功率而确定。如此,可以实现对目标数据集的隐私保护。
-
-
公开(公告)号:CN112860738B
公开(公告)日:2021-08-06
申请号:CN202110443996.3
申请日:2021-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2453 , G06F16/2455 , G06F21/62
Abstract: 本说明书实施例提供一种针对多方安全数据库的查询优化方法、装置和系统。查询优化方法包括,首先,中心设备接收当前查询,并生成该当前查询的多个执行计划;其中,当前查询涉及多个目标数据库。接着,中心设备针对各执行计划,确定出对应的成本计算式,所述成本计算式用于计算多个目标数据库联合执行该执行计划所需的执行成本。然后,多个目标数据库对应的多个查询引擎,采用与所述成本计算式对应的目标安全计算方式,执行多方安全计算MPC,得到安全计算结果;于是,中心设备根据安全计算结果,确定出各个成本计算式中成本值最低的优化执行计划。
-
公开(公告)号:CN113961967B
公开(公告)日:2022-03-22
申请号:CN202111517113.5
申请日:2021-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护联合训练自然语言处理NLP模型的方法,其中NLP模型包括位于第一方的编码网络和位于第二方的处理网络。根据该方法,第一方获取本地的目标训练语句后,将其输入编码网络,基于所述编码网络的编码输出,形成句子表征向量。然后,在句子表征向量上添加符合差分隐私的目标噪声,得到目标加噪表征。将该目标加噪表征发送至第二方,用于处理网络的训练。
-
公开(公告)号:CN113591133B
公开(公告)日:2021-12-24
申请号:CN202111133642.5
申请日:2021-09-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于差分隐私进行特征处理的方法及装置,所述方法涉及第一方和第二方,其中第一方存储多个样本的第一特征部分,第二方存储该多个样本的二分类标签;所述方法包括:第二方对多个样本对应的多个二分类标签分别进行加密,得到多个加密标签;第一方基于该多个加密标签以及差分隐私噪声,确定多个分箱中每个分箱对应的正样本加密加噪数量和负样本加密加噪数量,其中多个分箱是针对第一特征部分中的任一特征对多个样本进行分箱处理而得到;第二方对该正样本加密加噪数量和负样本加密加噪数量进行解密,得到正样本加噪数量和负样本加噪数量,从而确定出相对应分箱的加噪指标。
-
公开(公告)号:CN112860752B
公开(公告)日:2021-08-20
申请号:CN202110443580.1
申请日:2021-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2455 , G06F16/25
Abstract: 本说明书实施例中提供了一种针对多方安全数据库的数据查询方法、装置及系统。应用于中心节点的方法包括:接收来自数据请求方的数据查询请求,数据查询请求涉及存储于若干数据提供方的若干目标数据;确定数据查询请求是否满足若干目标数据各自的安全要求;当数据查询请求满足若干目标数据各自的安全要求时,对若干目标数据进行处理以获得结果数据;向数据请求方发送结果数据。中心节点根据存储于数据提供方的目标数据的安全要求,限制数据请求方对目标数据的查询情况,使数据提供方通过中心节点实现有限制的向外部共享目标数据,对共享场景提供安全的数据解决方案,有利于对目标数据中的部分或全部数据进行安全保护。
-
公开(公告)号:CN112860738A
公开(公告)日:2021-05-28
申请号:CN202110443996.3
申请日:2021-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2453 , G06F16/2455 , G06F21/62
Abstract: 本说明书实施例提供一种针对多方安全数据库的查询优化方法、装置和系统。查询优化方法包括,首先,中心设备接收当前查询,并生成该当前查询的多个执行计划;其中,当前查询涉及多个目标数据库。接着,中心设备针对各执行计划,确定出对应的成本计算式,所述成本计算式用于计算多个目标数据库联合执行该执行计划所需的执行成本。然后,多个目标数据库对应的多个查询引擎,采用与所述成本计算式对应的目标安全计算方式,执行多方安全计算MPC,得到安全计算结果;于是,中心设备根据安全计算结果,确定出各个成本计算式中成本值最低的优化执行计划。
-
公开(公告)号:CN114611131A
公开(公告)日:2022-06-10
申请号:CN202210502652.X
申请日:2022-05-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的确定共有数据的方法、装置和系统。第一方利用第一密钥,将其持有的第一数据集进行加密,将得到的单加密全数据集发送给第二方。第二方利用第二密钥对单加密全数据集再次加密,得到双加密全数据集,还基于本方的第二数据集进行下采样和基于第二密钥的单次加密,得到单加密采样数据集,发送给第一方。第一方又利用第一密钥对单加密采样数据集进行加密,得到双加密采样数据集,并确定双加密全数据集和双加密采样数据集的交集。此外,还对双加密采样数据集中除交集外的补集进行上采样,将得到的元素添加到交集,得到加噪交集,将其中的元素索引发送给第二方。第二方基于元素索引,确定与共有数据相关的信息。
-
公开(公告)号:CN113591133A
公开(公告)日:2021-11-02
申请号:CN202111133642.5
申请日:2021-09-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于差分隐私进行特征处理的方法及装置,所述方法涉及第一方和第二方,其中第一方存储多个样本的第一特征部分,第二方存储该多个样本的二分类标签;所述方法包括:第二方对多个样本对应的多个二分类标签分别进行加密,得到多个加密标签;第一方基于该多个加密标签以及差分隐私噪声,确定多个分箱中每个分箱对应的正样本加密加噪数量和负样本加密加噪数量,其中多个分箱是针对第一特征部分中的任一特征对多个样本进行分箱处理而得到;第二方对该正样本加密加噪数量和负样本加密加噪数量进行解密,得到正样本加噪数量和负样本加噪数量,从而确定出相对应分箱的加噪指标。
-
-
-
-
-
-
-
-
-