-
公开(公告)号:CN112948883B
公开(公告)日:2023-10-31
申请号:CN202110317328.6
申请日:2021-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私数据的多方联合建模的方法、装置和系统,方法包括:第一方将用户集中任意的第一用户对应的第一隐私数据输入第一神经网络模型,获取第一神经网络模型的目标隐层输出的中间数据;第一神经网络模型利用伪标签通过自监督方式训练得到,伪标签基于用户集中各用户的第一隐私数据而构造;将中间数据和第一用户的用户标识发送给第二方,以使第二方根据用户标识,对中间数据和第一用户对应的第二隐私数据整合后,利用第一用户对应的类别标签,对第二神经网络模型进行训练。能够在多方联合建模时,既保护隐私数据,又能够有效提升模型表现。
-
公开(公告)号:CN114092097A
公开(公告)日:2022-02-25
申请号:CN202111396497.X
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN113988225B
公开(公告)日:2022-05-06
申请号:CN202111597741.9
申请日:2021-12-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种建立表征提取模型、表征提取、类型识别的方法和装置。根据该实施例的方法,首先获取包含一个以上样本对的第一训练数据,样本对包括正样本对和负样本对;然后利用第一训练数据训练第一表征提取模型和第二表征提取模型,其中第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,第二表征提取模型用以利用用户的服务器侧特征提取用户的服务器侧表征向量;训练目标为最大化正样本对的终端侧表征向量与服务器侧表征向量之间的相似度且最小化负样本对的终端侧表征向量与服务器侧表征向量之间的相似度;再将训练得到的第一表征提取模型部署于终端设备。
-
公开(公告)号:CN113850309A
公开(公告)日:2021-12-28
申请号:CN202111082326.X
申请日:2021-09-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种训练样本生成及联邦学习方法,应用于至少两个相互协作的数据提供方之间的任一数据提供方,接收协作数据提供方发送的,用于表征每个特征的取值分布的特征值分布集合,并根据特征值分布集合,生成符合该特征值分布集合所表征的分布的数据,将生成的数据作为新的训练样本。由于接收的是表征特征的取值分布的特征值分布集合,使得该数据提供方无法通过接收的数据,反解得到每个用户的数据,保护了数据隐私;且使得该数据提供方得以生成足够的训练样本,实现了在保护数据隐私情况下的数据共享。
-
公开(公告)号:CN113850309B
公开(公告)日:2024-09-17
申请号:CN202111082326.X
申请日:2021-09-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0475 , G06N3/098 , G06N3/096 , G06F18/214 , G06N20/00
Abstract: 本说明书一个或多个实施例提供一种训练样本生成及联邦学习方法,应用于至少两个相互协作的数据提供方之间的任一数据提供方,接收协作数据提供方发送的,用于表征每个特征的取值分布的特征值分布集合,并根据特征值分布集合,生成符合该特征值分布集合所表征的分布的数据,将生成的数据作为新的训练样本。由于接收的是表征特征的取值分布的特征值分布集合,使得该数据提供方无法通过接收的数据,反解得到每个用户的数据,保护了数据隐私;且使得该数据提供方得以生成足够的训练样本,实现了在保护数据隐私情况下的数据共享。
-
公开(公告)号:CN114462502B
公开(公告)日:2024-07-12
申请号:CN202210011293.8
申请日:2022-01-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/22 , G06F18/241 , G06F21/62
Abstract: 本说明书公开了一种核身推荐模型训练方法及装置。所述方法包括:获取训练样本集合;所述训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本;根据所述训练样本集合,预训练所述表征模型;预训练后的表征模型用于将输入的样本特征映射到第一向量空间中,针对相同推荐标签的样本减小第一向量空间映射结果之间的距离;获取任一业务场景中的若干训练样本,将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果,根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签,训练该业务场景对应的预测模型。
-
公开(公告)号:CN114692828A
公开(公告)日:2022-07-01
申请号:CN202210295134.5
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种训练神经网络的方法、装置、设备及存储介质,所述神经网络为由第一神经网络和第二神经网络组成的孪生神经网络,且第一神经网络和第二神经网络具有相同的网络结构和网络参数;所述方法包括:获取预设训练数据集中所有的训练数据,训练数据包括有标签数据和无标签数据;将获取到的有标签数据和无标签数据成对输入所述孪生神经网络进行分类训练,其中,有标签数据被输入所述第一神经网络,无标签数据被输入所述第二神经网络;确定所述第一神经网络的第一目标网络参数;将所述第二神经网络的网络参数更新为第一目标网络参数;基于所述第一目标网络参数确定目标孪生神经网络。
-
公开(公告)号:CN114092097B
公开(公告)日:2024-05-24
申请号:CN202111396497.X
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN112948883A
公开(公告)日:2021-06-11
申请号:CN202110317328.6
申请日:2021-03-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私数据的多方联合建模的方法、装置和系统,方法包括:第一方将用户集中任意的第一用户对应的第一隐私数据输入第一神经网络模型,获取第一神经网络模型的目标隐层输出的中间数据;第一神经网络模型利用伪标签通过自监督方式训练得到,伪标签基于用户集中各用户的第一隐私数据而构造;将中间数据和第一用户的用户标识发送给第二方,以使第二方根据用户标识,对中间数据和第一用户对应的第二隐私数据整合后,利用第一用户对应的类别标签,对第二神经网络模型进行训练。能够在多方联合建模时,既保护隐私数据,又能够有效提升模型表现。
-
公开(公告)号:CN116167347A
公开(公告)日:2023-05-26
申请号:CN202310329061.1
申请日:2023-03-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种表格型交易数据的深度学习方法及装置、介质、设备。方法包括:从表格型交易数据中提取出N个先验特征,将每一个所述先验特征转化为对应的特征向量;计算所述表格型交易数据对应的第一注意力得分矩阵;将每一个所述特征向量和对应的所述第一注意力得分向量进行融合,得到对应的第二注意力得分向量;根据由N个所述第二注意力得分向量形成的第二注意力得分矩阵,对所述表格型交易数据进行深度学习,以确定所述表格型交易数据中交易行为信息和标签信息之间的关系。本说明书实施例提供一种适合表格型的交易数据的深度学习方案,减少先验知识的丢失,提高深度学习结果的准确性。
-
-
-
-
-
-
-
-
-