-
公开(公告)号:CN116049761A
公开(公告)日:2023-05-02
申请号:CN202211734588.4
申请日:2022-12-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/25 , G06F18/2413 , G06F18/2433 , G06F18/2451 , G06F18/241 , G06N3/08 , G06F16/2457
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与执行目标业务相关的目标数据;基于预先训练的风险检测模型和预设检索数据库,对所述目标数据进行匹配检测处理,得到所述预设检索库中与所述目标数据具有相关关系的候选数据,并基于所述候选数据对应的风险类型,确定所述目标数据对应的风险类型;基于所述候选数据及对应的风险类型,对预设线性模型进行训练,得到训练后的线性模型,并基于所述训练后的线性模型每一维的模型参数,确定所述目标数据每一维度的特征的重要性;基于所述目标数据对应的风险类型和所述目标数据每一维度的特征的重要性,确定执行所述目标业务是否存在风险。
-
公开(公告)号:CN115983858A
公开(公告)日:2023-04-18
申请号:CN202211675809.5
申请日:2022-12-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型的处理、风险防控的处理方法、装置及设备,该模型的处理方法包括:获取应用于元学习的样本数据,该样本数据中包括对应事件的特征、样本标签信息和支撑集,支撑集中包括多个不同的事件类别,以及每个事件类别对应的支撑样本数据;基于样本数据、支撑集中不同事件类别的支撑样本数据对应的注意力权重和支撑集中不同事件类别包含的支撑样本数据的数量,确定支撑集中不同事件类别对应的第一类别中心,并基于样本数据,确定支撑集中不同事件类别对应的特征的均值作为不同事件类别对应的第二类别中心;基于第一类别中心、第二类别中心和样本数据对应用于可信场景中的目标模型进行模型训练,得到训练后的目标模型。
-
公开(公告)号:CN113256300B
公开(公告)日:2023-04-07
申请号:CN202110582927.0
申请日:2021-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供了一种交易的处理方法及装置,该方法包括:接收第一用户的交易请求;其中,该交易请求指示第一用户与第二用户进行交易;获取与上述交易请求相关联的历史记录数据;根据该历史记录数据,采用机器学习模型预测上述交易是否为可信交易;其中,该交易被判定为可信交易的条件包括该交易不存在囤号风险;其中,上述历史记录数据包括以下数据中的至少一种:第一用户的历史点击行为序列数据、第一用户的交易关系数据、第二用户的交易关系数据,以及第一用户与第二用户之间的历史交易数据。
-
公开(公告)号:CN115758139A
公开(公告)日:2023-03-07
申请号:CN202211399298.9
申请日:2022-11-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/23 , G06F18/25 , G06F21/62
Abstract: 本说明书实施例提供了一种风控模型的训练方法及装置。其中,风控模型用于识别高风险用户。在训练风控模型时,可以首先对用户样本集中的多个用户样本进行聚类。用户样本集包括高风险用户样本和低风险用户样本,经过聚类后,可以得到表征若干个风险用户类型和若干个正常用户类型的聚类中心。接着,针对任意一个用户样本,确定该用户样本分别与多个聚类中心之间的相关性;针对任意一个用户样本,基于与该用户样本对应的多个相关性之间的叠加,确定该用户样本的融合了聚类中心特征的深层特征。然后,可以基于多个用户样本的深层特征,对风控模型进行训练。
-
公开(公告)号:CN115545572A
公开(公告)日:2022-12-30
申请号:CN202211508347.8
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种业务风控的方法、装置、设备及存储介质,可以通过双塔模型的第一特征提取子网,提取出用户的业务数据的第一特征,从而可以从通过双塔模型的第二特征提取子网提取出的各历史业务数据的第二特征中,匹配出参考特征,进而可以根据参考特征对应的历史业务数据的风控结果对用户的业务进行风控。
-
公开(公告)号:CN114912549B
公开(公告)日:2022-12-13
申请号:CN202210807503.4
申请日:2022-07-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了风险交易识别模型的训练方法、风险交易识别方法和装置。根据实施例的方法,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当用于模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型对风险交易进行识别的准确性。
-
公开(公告)号:CN114692892A
公开(公告)日:2022-07-01
申请号:CN202210285951.2
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
公开(公告)号:CN113297396B
公开(公告)日:2022-05-20
申请号:CN202110824981.1
申请日:2021-07-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于联邦学习的模型参数更新方法、装置及设备,其中,该方法包括:接收联邦学习服务端下发的针对目标图神经网络模型的模型参数更新指令,所述模型参数更新指令携带有第一共享参数,所述目标图神经网络模型为多个所述联邦学习客户端的共有模型;基于所述第一共享参数、本地存储的第一独立参数,以及由本地用户私有数据构建的图谱数据,对所述目标图神经网络模型进行训练,得到训练后的所述目标图神经网络模型的模型参数;将所述第二共享参数发送给所述联邦学习服务端,以使所述联邦学习服务端基于多个联邦学习客户端发送的第二共享参数,对所述目标图神经网络模型的第一共享参数进行更新处理。
-
公开(公告)号:CN113255891A
公开(公告)日:2021-08-13
申请号:CN202110587002.5
申请日:2021-05-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种通过高阶特征交互对事件进行处理的方法和神经网络模型。在该方法中,首先获取目标事件的编码向量;然后对该编码向量进行非线性变换,得到第一特征向量,其中所有元素均为正数。接着,对于多种高阶特征组合中任意的第一组合,利用与第一组合对应的第一组合矩阵处理该第一特征向量的自然对数,得到中间向量,并基于中间向量的自然指数确定第一组合对应的特征交互向量;其中,多种高阶特征组合中每种组合,对应于第一特征向量中多个向量元素的相乘组合。于是,至少基于上述多种高阶特征组合各自对应的特征交互向量,确定目标事件的事件表征向量;进而进行与事件相关的业务预测。
-
公开(公告)号:CN118428404A
公开(公告)日:2024-08-02
申请号:CN202410472853.9
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/042 , G06N3/0895 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06N3/0455 , G06N3/096
Abstract: 本说明书实施例公开了一种模型的知识蒸馏方法、装置及设备,该方法包括:获取预设的噪声数据,将噪声数据输入到预先训练的生成器中,得到训练样本数据,并获取用于描述训练样本数据的标签信息的文本数据,基于文本数据,通过预训练的文本编码器,确定文本数据对应的文本编码数据,训练样本数据包括金融交易中扫描的图像数据,将训练样本数据输入到预先训练的教师模型中,得到第一输出结果,将训练样本数据和文本编码数据输入到学生模型中,得到第二输出结果,教师模型是用于在金融交易中对扫描的图像进行风险防控的模型,基于第一输出结果和第二输出结果,通过预设的损失函数,使用教师模型对学生模型进行知识蒸馏训练。
-
-
-
-
-
-
-
-
-