-
公开(公告)号:CN115564450B
公开(公告)日:2023-03-10
申请号:CN202211556873.1
申请日:2022-12-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40
Abstract: 本说明书公开了一种风控方法、装置、存储介质及设备,通过根据异常业务的业务数据对各异常业务进行聚类,得到各业务簇及各业务簇分别对应的典型业务。以针对每个典型业务,根据该典型业务的业务数据,通过解释模型确定该典型业务被识别为异常的原因。并根据剩余异常业务与各典型业务的相似度及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,以根据各异常业务被识别为异常业务的原因执行风控业务。可通过聚类确定用于输入解释模型的典型业务,基于模型输出的典型业务被识别为异常业务的原因确定其他异常业务被识别为异常业务的原因,减少输入模型的数据量,减少模型计算耗时,提升确定原因的效率以提升风控效率。
-
公开(公告)号:CN115408449B
公开(公告)日:2023-03-07
申请号:CN202211332029.0
申请日:2022-10-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2458 , G06F18/22 , G06Q20/40
Abstract: 本说明书实施例公开了一种用户行为的处理方法、装置及设备,该方法包括:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置。
-
公开(公告)号:CN115345233A
公开(公告)日:2022-11-15
申请号:CN202210974842.1
申请日:2022-08-15
Applicant: 清华大学 , 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法应用于终端设备,包括:接收服务器发送的第一模型,获取第一训练样本数据,以对第一模型进行训练,并对第一模型的模型结构进行调整,得到目标模型,将目标模型对应的模型更新数据发送给服务器,以使服务器确定得到目标模型所使用的时长,并基于不同终端设备提供的模型更新数据对当前的模型进行更新,得到第二模型,并在确定第二模型需要裁剪时,确定对第二模型的裁剪程度和对第二模型进行训练所使用的时长,获取第二训练样本数据,并结合对第二模型进行训练所使用的时长对第二模型进行训练,并通过该裁剪程度对第二模型进行调整,得到第三模型,将第三模型发送给服务器。
-
公开(公告)号:CN117744837A
公开(公告)日:2024-03-22
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN117194992A
公开(公告)日:2023-12-08
申请号:CN202311454844.9
申请日:2023-11-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/25 , G06F9/50 , G06N3/0499 , G06N3/08
Abstract: 本说明书公开一种模型训练、任务执行方法、装置、存储介质及设备,中心服务器可以基于各下游任务的共性样本对初始模型进行预训练,得到具有执行各下游任务的基础能力的预训练模型,进而可以通过将预训练模型的模型参数发送给每个下游服务器,以使得每个下游服务器基于本地样本对预训练模型中的调整层进行训练,得到训练后模型,并将训练后模型的调整层的网络参数返回,中心服务器可以根据各下游服务器返回的调整层网络参数,对预训练模型的调整层进行更新,得到目标模型,从而使得可以通过预训练模型的调整层学习到不同下游服务器所私有的本地样本和预训练过程中使用的共性样本之间的潜在联系,进而使得目标模型在下游任务中的性能得到提升。
-
公开(公告)号:CN116128072B
公开(公告)日:2023-08-25
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN116128072A
公开(公告)日:2023-05-16
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN115456788B
公开(公告)日:2023-03-21
申请号:CN202211387148.6
申请日:2022-11-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种风险群组的检测方法、装置及设备,该方法包括:接收风险群组的检测请求,获取待处理的多个不同用户的目标数据,并对多个不同用户的目标数据进行聚类处理,得到一个或多个由目标数据构成的用户群组,目标数据中包括一种或多种不同的数据特征;基于多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个用户群组和每个用户群组中包含的目标数据,分别确定每个用户群组中包含的用户数量和每种数据特征的数量;基于每种数据特征对应的出现概率,以及每个用户群组中包含的用户数量和每个数据特征的数量,确定每个用户群组中包含的每种数据特征分布的出现概率,进而确定存在预设风险的用户群组。
-
公开(公告)号:CN115423485B
公开(公告)日:2023-03-21
申请号:CN202211369675.4
申请日:2022-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06Q30/012 , G06Q40/03 , G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标数据,并获取所述目标数据与每个候选用户意图对应的目标概率,所述目标数据包括人机交互过程中用户的输入数据;对所述目标数据进行划分,得到多个子数据,并基于预设梯度积分算法,获取每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度;基于所述目标数据与每个候选用户意图对应的目标概率,以及所述每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度,确定所述目标数据对应的目标用户意图。
-
公开(公告)号:CN115618237A
公开(公告)日:2023-01-17
申请号:CN202211590716.2
申请日:2022-12-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/24
Abstract: 本说明书提供了一种模型训练的方法、装置、存储介质及电子设备。在本说明书提供的模型训练方法中,获取训练样本、样本标签以及打标环境信息;将所述训练样本输入待训练的目标模型中,确定所述目标模型的输出结果;将所述打标环境信息输入置信度网络中,通过所述置信度网络输出所述样本标签的置信度;根据所述样本标签的置信度,调整所述目标模型的输出结果,得到修正结果;以所述修正结果与所述样本标签之间的差异最小为优化目标,对所述目标模型与所述置信度网络进行训练。采用本说明书提供的模型训练方法对模型进行有监督训练时,能够根据样本标签的可信程度对模型的输出结果进行修正,保证模型的训练效果,同时使标签的利用率最大化。
-
-
-
-
-
-
-
-
-