-
公开(公告)号:CN117194992B
公开(公告)日:2024-04-19
申请号:CN202311454844.9
申请日:2023-11-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/25 , G06F9/50 , G06N3/0499 , G06N3/08
Abstract: 本说明书公开一种模型训练、任务执行方法、装置、存储介质及设备,中心服务器可以基于各下游任务的共性样本对初始模型进行预训练,得到具有执行各下游任务的基础能力的预训练模型,进而可以通过将预训练模型的模型参数发送给每个下游服务器,以使得每个下游服务器基于本地样本对预训练模型中的调整层进行训练,得到训练后模型,并将训练后模型的调整层的网络参数返回,中心服务器可以根据各下游服务器返回的调整层网络参数,对预训练模型的调整层进行更新,得到目标模型,从而使得可以通过预训练模型的调整层学习到不同下游服务器所私有的本地样本和预训练过程中使用的共性样本之间的潜在联系,进而使得目标模型在下游任务中的性能得到提升。
-
公开(公告)号:CN117540791B
公开(公告)日:2024-04-05
申请号:CN202410013557.2
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/094 , G06N3/0464 , G06N3/045 , G06N3/044 , G06N3/0475 , G06N3/084 , G06F18/23213 , G06Q20/40
Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。
-
公开(公告)号:CN116306868B
公开(公告)日:2024-01-05
申请号:CN202310217203.5
申请日:2023-03-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:将目标域的目标数据分别输入第一教师模型和第二教师模型中,得到第一教师模型对应的第一输出数据和第二教师模型对应的第二输出数据,第一教师模型是源域的模型,第二教师模型是目标域的模型;将目标数据输入到数据选择模型中,得到第一教师模型和第二教师模型的重要性权重,并基于上述重要性权重和两个输出数据,确定目标数据对应的教师输出结果;将目标数据输入到第一学生模型中,得到目标数据对应的第一学生输出结果;基于教师输出结果、第一学生输出结果和目标数据对应的标签信息,通过预设的损失函数,使用第一教师模型和第二教师模型对第一学生模型进行知识蒸馏训练。
-
公开(公告)号:CN111538794B
公开(公告)日:2023-10-03
申请号:CN202010334175.1
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种数据融合方法、装置及设备。方案包括:获取第一数据集中的第一实体数据的第一基础数据;获取第二数据集中的第二实体数据的第二基础数据;基于所述第一基础数据和所述第二基础数据判断所述第一实体与所述第二实体是否为同一行为实体,得到判断结果;当所述判断结果表示所述第一实体与所述第二实体为同一行为实体时,将所述第一实体数据和所述第二实体数据合并为第三实体数据,所述第三实体数据用于描述所述行为实体,所述第三实体数据中包含的基础数据的信息大于所述第一实体数据,且大于所述第二实体数据。
-
公开(公告)号:CN116150622A
公开(公告)日:2023-05-23
申请号:CN202310183952.0
申请日:2023-02-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06N20/00 , G06F21/62
Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备。确定当前迭代过程对应的噪声值,以及基于每个训练样本分别确定出的调整模型参数的梯度,根据各梯度以及预设的第一超参数,分别确定各梯度权重,根据各梯度以及各梯度权重,确定各自适应梯度,基于训练样本确定出的梯度越大则自适应梯度与预设的梯度期望值的差越小,根据噪声值对各各自适应梯度之和加噪,以得到当前迭代过程的批次平均梯度,最后根据批次平均梯度,调整所述待训练模型的参数。可以减少小梯度样本对模型参数影响程度,使得模型训练效果更好,基于训练得到的模型执行业务的结果更准确。
-
公开(公告)号:CN115828171B
公开(公告)日:2023-05-16
申请号:CN202310142321.4
申请日:2023-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F21/62
Abstract: 本说明书公开了一种端云协同执行业务的方法、装置、介质及设备,响应于用户操作,确定业务请求,并根据业务请求获取用户数据,确定用户数据中的敏感数据以及非敏感数据。对敏感数据进行特征提取,确定第一特征,将非敏感数据发送到服务器,使服务器对非敏感数据进行特征提取,确定第二特征,接收服务器返回的第二特征。将第一特征与第二特征输入输出层,确定输出结果。对输出结果进行加噪,确定业务请求的加噪输出结果,并将加噪输出结果发送给服务器,使服务器根据加噪输出结果执行业务。使得即使攻击者获取到业务模型以及输出结果,也不能反推出各输出结果对应的用户数据,实现了对用户隐私数据的保护。
-
公开(公告)号:CN115828171A
公开(公告)日:2023-03-21
申请号:CN202310142321.4
申请日:2023-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F21/62
Abstract: 本说明书公开了一种端云协同执行业务的方法、装置、介质及设备,响应于用户操作,确定业务请求,并根据业务请求获取用户数据,确定用户数据中的敏感数据以及非敏感数据。对敏感数据进行特征提取,确定第一特征,将非敏感数据发送到服务器,使服务器对非敏感数据进行特征提取,确定第二特征,接收服务器返回的第二特征。将第一特征与第二特征输入输出层,确定输出结果。对输出结果进行加噪,确定业务请求的加噪输出结果,并将加噪输出结果发送给服务器,使服务器根据加噪输出结果执行业务。使得即使攻击者获取到业务模型以及输出结果,也不能反推出各输出结果对应的用户数据,实现了对用户隐私数据的保护。
-
公开(公告)号:CN115564450B
公开(公告)日:2023-03-10
申请号:CN202211556873.1
申请日:2022-12-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40
Abstract: 本说明书公开了一种风控方法、装置、存储介质及设备,通过根据异常业务的业务数据对各异常业务进行聚类,得到各业务簇及各业务簇分别对应的典型业务。以针对每个典型业务,根据该典型业务的业务数据,通过解释模型确定该典型业务被识别为异常的原因。并根据剩余异常业务与各典型业务的相似度及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,以根据各异常业务被识别为异常业务的原因执行风控业务。可通过聚类确定用于输入解释模型的典型业务,基于模型输出的典型业务被识别为异常业务的原因确定其他异常业务被识别为异常业务的原因,减少输入模型的数据量,减少模型计算耗时,提升确定原因的效率以提升风控效率。
-
公开(公告)号:CN115408449B
公开(公告)日:2023-03-07
申请号:CN202211332029.0
申请日:2022-10-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2458 , G06F18/22 , G06Q20/40
Abstract: 本说明书实施例公开了一种用户行为的处理方法、装置及设备,该方法包括:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置。
-
公开(公告)号:CN115563584A
公开(公告)日:2023-01-03
申请号:CN202211509842.0
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/25 , G06F18/214 , G06Q40/02 , G06N3/04 , G06N3/08
Abstract: 本说明书公开了一种模型训练方法、装置、存储介质及电子设备,在对检测模型进行训练的过程中,可以使检测模型能够区分出输入的用户数据归属的业务类别,并且能够根据归属于不同业务类别的用户数据,确定出用户的业务请求是否属于异常业务请求的检测结果,从而可以降低对用户的业务请求进行异常检测的成本。
-
-
-
-
-
-
-
-
-