-
公开(公告)号:CN111291183B
公开(公告)日:2021-08-03
申请号:CN202010049397.9
申请日:2020-01-16
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种利用文本分类模型进行分类预测的方法和装置,其中文本分类模型包括嵌入层、卷积层、注意力层和分类器。分类预测方法包括,预先对K个类别对应的标签描述文本进行词嵌入,得到K个标签向量。预测时,利用嵌入层对输入文本进行词嵌入,得到词向量序列;在卷积层,利用不同宽度的卷积窗口,对词向量序列进行卷积处理,得到片段向量序列。然后,在注意力层,分别对各个向量序列进行第一注意力处理,包括,根据向量序列中向量元素与K个标签向量之间的相似度,确定其权重因子,进而加权求和得到第一序列向量。基于各个序列的第一序列向量得到输入文本的表征向量,于是分类器基于表征向量,得到输入文本的类别预测结果。
-
公开(公告)号:CN111405563B
公开(公告)日:2021-07-13
申请号:CN202010213835.0
申请日:2020-03-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04W12/12 , H04W12/121 , G06F21/62
Abstract: 本说明书实施例提供一种保护用户隐私的风险检测方法和装置,方法包括:第一终端设备根据与其对应的第一用户的关联信息,确定第一子图,第一子图包括中心节点和中心节点的关联节点,中心节点对应第一用户,关联节点对应与第一用户具有关联关系的第二用户;第一终端设备向服务器发送第一子图,以使服务器根据第一子图更新全局图,并根据更新后的全局图确定第一子图的图嵌入信息,图嵌入信息至少包括第一子图中各节点分别对应的节点特征向量;全局图根据多个终端设备发送的子图而建立;第一终端设备从服务器接收图嵌入信息;第一终端设备根据图嵌入信息,确定第一子图对应的风险评估结果,用于进行风险决策。能够有效的保护用户隐私。
-
公开(公告)号:CN112541575A
公开(公告)日:2021-03-23
申请号:CN202011409587.3
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图神经网络的训练方法,包括:获取原始关系网络图,其中包括对应多个业务对象的多个对象节点,以及对象节点之间存在关联关系而形成的原始连接边;在该原始关系网络图中添加若干记忆节点,并在每个记忆节点和每个对象节点之间建立新增连接边,得到扩张关系网络图,用于对图神经网络进行多轮迭代更新,其中任一轮包括:利用图神经网络对扩张关系网络图进行图嵌入处理,在多个图神经网络隐层中的任一隐层,对上一隐层针对第一对象节点、其若干邻居对象节点和若干记忆节点输出的隐向量进行聚合,得到本隐层输出的第一对象隐向量;根据最后一个隐层输出的第一对象隐向量以及第一对象节点的业务标签,对图神经网络进行本轮更新。
-
公开(公告)号:CN111405563A
公开(公告)日:2020-07-10
申请号:CN202010213835.0
申请日:2020-03-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护用户隐私的风险检测方法和装置,方法包括:第一终端设备根据与其对应的第一用户的关联信息,确定第一子图,第一子图包括中心节点和中心节点的关联节点,中心节点对应第一用户,关联节点对应与第一用户具有关联关系的第二用户;第一终端设备向服务器发送第一子图,以使服务器根据第一子图更新全局图,并根据更新后的全局图确定第一子图的图嵌入信息,图嵌入信息至少包括第一子图中各节点分别对应的节点特征向量;全局图根据多个终端设备发送的子图而建立;第一终端设备从服务器接收图嵌入信息;第一终端设备根据图嵌入信息,确定第一子图对应的风险评估结果,用于进行风险决策。能够有效的保护用户隐私。
-
公开(公告)号:CN111400754A
公开(公告)日:2020-07-10
申请号:CN202010174719.2
申请日:2020-03-11
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种保护用户隐私的用户分类系统的构建方法。该方法包括:先将包括原始敏感数据的原始用户数据输入基于差分隐私的特征编码器中,得到对应的特征表示;然后,一方面,将该特征表示输入用户分类器中,得到分类结果,并结合该原始用户数据对应的分类标签,确定第一损失,用于训练该用户分类器,另一方面,将该特征表示输入第一解码器中,得到模拟该原始敏感数据的复原敏感数据,并基于该复原敏感数据和该原始敏感数据,确定第二损失,以及以最小化该第二损失为目标,训练该第一解码器;接着,以最小化该第一损失以及最大化该第二损失为目标,训练该特征编码器;最后将训练后的该特征编码器和该用户分类器,构建为该用户分类系统。
-
公开(公告)号:CN111046422A
公开(公告)日:2020-04-21
申请号:CN201911252327.7
申请日:2019-12-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。
-
公开(公告)号:CN110852450B
公开(公告)日:2020-04-14
申请号:CN202010040234.4
申请日:2020-01-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种识别对抗样本以保护隐私安全的方法,该方法包括:首先,对涉及隐私数据的多个非对抗样本进行采样,得到第一对照样本集;接着,向第一对照样本集中加入待检测的目标样本,得到第一实验样本集;然后,分别利用第一对照样本集和第一实验样本集对初始机器学习模型进行训练,得到训练后的第一对照模型和第一实验模型;再接着,利用测试样本集分别对第一对照模型和第一实验模型进行性能评估,得到针对预设评估指标的第一对照值和第一实验值;再然后,计算第一对照值和第一实验值的差值,作为目标样本针对模型性能的第一增益值。由此,可以基于第一增益值或重复上述流程而得到的多个增益值,判别目标样本是否为对抗样本。
-
公开(公告)号:CN115081640A
公开(公告)日:2022-09-20
申请号:CN202210636831.2
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于差分隐私的联邦学习方法及装置、电子设备,该方法应用于任一终端设备,包括多次迭代,每次迭代包括:基于训练数据和当前本地参数,确定待处理的第一梯度向量,对第一梯度向量进行多级量化处理,得到第二梯度向量,在第二梯度向量的向量空间中,基于第二梯度向量,生成第一向量集合和第二向量集合,进行满足差分隐私的采样,以从第一向量集合或第二向量集合中随机采样出第三梯度向量。对第三梯度向量进行归一化,得到目标梯度向量,并向服务器上传目标梯度向量。能够提高联邦学习过程中的通讯效率,从而提高了联邦学习的效率。
-
公开(公告)号:CN113159288B
公开(公告)日:2022-06-28
申请号:CN202110440032.3
申请日:2019-12-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。
-
公开(公告)号:CN111400754B
公开(公告)日:2021-10-01
申请号:CN202010174719.2
申请日:2020-03-11
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 熊涛
Abstract: 本说明书实施例提供一种保护用户隐私的用户分类系统的构建方法。该方法包括:先将包括原始敏感数据的原始用户数据输入基于差分隐私的特征编码器中,得到对应的特征表示;然后,一方面,将该特征表示输入用户分类器中,得到分类结果,并结合该原始用户数据对应的分类标签,确定第一损失,用于训练该用户分类器,另一方面,将该特征表示输入第一解码器中,得到模拟该原始敏感数据的复原敏感数据,并基于该复原敏感数据和该原始敏感数据,确定第二损失,以及以最小化该第二损失为目标,训练该第一解码器;接着,以最小化该第一损失以及最大化该第二损失为目标,训练该特征编码器;最后将训练后的该特征编码器和该用户分类器,构建为该用户分类系统。
-
-
-
-
-
-
-
-
-