-
公开(公告)号:CN119295078A
公开(公告)日:2025-01-10
申请号:CN202411312840.1
申请日:2024-09-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06Q20/38 , G06F18/241
Abstract: 本说明书公开了一种风险识别的方法、装置、存储介质和电子设备,所述方法包括:先获取待风控用户的若干交易事件,以及确定由各交易事件组成的序列数据。对序列数据进行编码,得到序列向量。按照预设维度,对序列向量进行矩阵变换,得到第一向量。将第一向量输入风控大模型,确定待风控用户对应的风险识别结果。通过不包括事件表征层且模型参数大的风控大模型对待风控用户进行风险识别,使得得到的风险识别结果更加准确,有利于对待风控用户进行更加精确的风险控制。
-
公开(公告)号:CN114092097B
公开(公告)日:2024-05-24
申请号:CN202111396497.X
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN117787443A
公开(公告)日:2024-03-29
申请号:CN202311868400.X
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06N5/04 , G06F40/186
Abstract: 本说明书公开了一种风控方法、装置、设备及可读存储介质,根据用于描述用户事件中各用户行为的描述文本确定的参考文本序列作为训练样本,对预训练的自然语言模型进行微调,得到行为序列生成模型,根据行为序列生成模型和提示文本,得到目标文本序列,以目标文本序列为对抗样本,对风控模型进行优化,通过优化后的风控模型进行风控。可见,通过上述方案,无需与风控模型反复交互就得到行为序列生成模型生成的对抗样本,低成本、高效地提高了风控模型的鲁棒性和精度,并且,在预训练的自然语言模型的基础上微调得到的行为序列生成模型,能够适用于以用户行为作为训练样本的多个不同的风控模型,提高了风控模型的优化效率以及隐私数据的安全性。
-
公开(公告)号:CN116049761A
公开(公告)日:2023-05-02
申请号:CN202211734588.4
申请日:2022-12-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/25 , G06F18/2413 , G06F18/2433 , G06F18/2451 , G06F18/241 , G06N3/08 , G06F16/2457
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与执行目标业务相关的目标数据;基于预先训练的风险检测模型和预设检索数据库,对所述目标数据进行匹配检测处理,得到所述预设检索库中与所述目标数据具有相关关系的候选数据,并基于所述候选数据对应的风险类型,确定所述目标数据对应的风险类型;基于所述候选数据及对应的风险类型,对预设线性模型进行训练,得到训练后的线性模型,并基于所述训练后的线性模型每一维的模型参数,确定所述目标数据每一维度的特征的重要性;基于所述目标数据对应的风险类型和所述目标数据每一维度的特征的重要性,确定执行所述目标业务是否存在风险。
-
公开(公告)号:CN113256300B
公开(公告)日:2023-04-07
申请号:CN202110582927.0
申请日:2021-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供了一种交易的处理方法及装置,该方法包括:接收第一用户的交易请求;其中,该交易请求指示第一用户与第二用户进行交易;获取与上述交易请求相关联的历史记录数据;根据该历史记录数据,采用机器学习模型预测上述交易是否为可信交易;其中,该交易被判定为可信交易的条件包括该交易不存在囤号风险;其中,上述历史记录数据包括以下数据中的至少一种:第一用户的历史点击行为序列数据、第一用户的交易关系数据、第二用户的交易关系数据,以及第一用户与第二用户之间的历史交易数据。
-
公开(公告)号:CN115170304B
公开(公告)日:2023-03-28
申请号:CN202210710741.3
申请日:2022-06-22
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 杨阳
IPC: G06Q40/04 , G06Q10/04 , G06N3/08 , G06F16/242
Abstract: 本说明书实施例描述了风险特征描述的提取方法和装置。根据实施例的方法,首先获取进行风险交易预测的风险交易数据,以及随机从交易记录数据中获取的随机交易数据。然后分别将风险交易数据和随机交易数据输入到风险交易预测模型中,并从风险交易预测模型的一个非输出层的神经元层中输出各自的交易表征。进而根据各自得到的交易表征在判定风险交易是否具有风险时的重要性即可确定出能够进行风险判定的风险特征描述。如此,风险交易表征和随机交易表征在进行风险判定时,其重要程度会形成显著的对照差异,基于此重要程度的差异即可准确地确定出能够对交易进行风险判定的风险特征描述。
-
公开(公告)号:CN114692892A
公开(公告)日:2022-07-01
申请号:CN202210285951.2
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
公开(公告)号:CN113297396B
公开(公告)日:2022-05-20
申请号:CN202110824981.1
申请日:2021-07-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于联邦学习的模型参数更新方法、装置及设备,其中,该方法包括:接收联邦学习服务端下发的针对目标图神经网络模型的模型参数更新指令,所述模型参数更新指令携带有第一共享参数,所述目标图神经网络模型为多个所述联邦学习客户端的共有模型;基于所述第一共享参数、本地存储的第一独立参数,以及由本地用户私有数据构建的图谱数据,对所述目标图神经网络模型进行训练,得到训练后的所述目标图神经网络模型的模型参数;将所述第二共享参数发送给所述联邦学习服务端,以使所述联邦学习服务端基于多个联邦学习客户端发送的第二共享参数,对所述目标图神经网络模型的第一共享参数进行更新处理。
-
公开(公告)号:CN114692724B
公开(公告)日:2023-03-28
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G06N3/047 , G06N3/08
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN115600106A
公开(公告)日:2023-01-13
申请号:CN202211276933.4
申请日:2022-10-18
Applicant: 支付宝(杭州)信息技术有限公司(CN)
IPC: G06F18/214 , G06F18/24 , G06F18/22 , G06Q20/40
Abstract: 本说明书公开了一种风险识别模型的训练方法、装置、设备及存储介质,将训练样本输入待训练的风险识别模型,通过特征子网得到训练样本的第一特征,根据全连接层中的各参数对第一特征进行线性变换得到第二特征,通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索,扩展了风险识别的应用场景,提高了风险识别的准确性以及隐私的保护性。
-
-
-
-
-
-
-
-
-