-
公开(公告)号:CN119599731A
公开(公告)日:2025-03-11
申请号:CN202410977913.2
申请日:2024-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0226 , G06F18/2415 , G06F18/214 , G06Q40/04
Abstract: 本说明书实施例公开了一种奖励预测模型训练和管控动作推荐模型优化方法、装置,首先,基于预采集的交易特征数据以及预先训练好的初始管控动作推荐模型,构建奖励训练数据;根据奖励训练数据对预构建的奖励预测模型进行监督学习,得到初始奖励预测模型;获取预设的辅助学习标签,辅助学习标签对应不同的学习任务,并根据辅助学习标签对初始奖励预测模型进行多任务学习,得到目标奖励预测模型。通过多任务学习得到的目标奖励预测模型,可以实现在强化学习过程中的奖励信号的预测,有效降低人工成本,提高奖励信号的预测效率,同时保证预测的奖励信号的合理性和有效性,提升奖励信号的可解释性。
-
公开(公告)号:CN117252250A
公开(公告)日:2023-12-19
申请号:CN202311176837.7
申请日:2023-09-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0895 , G06N3/0455
Abstract: 本说明书一个或多个实施例公开了一种大模型预训练方法及装置。首先通过大模型的第一输入通道获取第一模态数据集,并通过大模型的第二输入通道获取第二模态数据集;然后将第一模态数据集中的模态数据输入到大模型中的第一编码器,得到第一表征信息,将第二模态数据集中包含的多种模态数据分别输入到大模型中的第二编码器,并将第二模态数据集对应第二编码器的输出结果进行表征融合处理,得到第二表征信息;最后将第一表征信息和第二表征信息映射到预设的特征空间,并基于特征空间的映射信息和预设的对比学习损失函数对大模型进行对比学习训练,得到预训练后的大模型,对比学习损失函数基于实体之间的表征相似性确定。
-
公开(公告)号:CN117093863A
公开(公告)日:2023-11-21
申请号:CN202311007524.9
申请日:2023-08-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/241 , G06F16/35 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取用于训练目标模型的第一样本数据和第二样本数据,第一样本数据的第一标签信息的准确度高于第二样本数据的第二标签信息的准确度;基于第一样本数据、第二样本数据、目标模型对应的业务的信息、第一标签信息和第二标签信息,对预训练的样本权重模型进行模型训练,得到训练后的样本权重模型;基于第二样本数据和第二标签信息,通过训练后的样本权重模型确定第二样本数据的置信度;基于第二样本数据、第二标签信息和第二样本数据的置信度,对目标模型进行模型训练,得到训练后的目标模型。
-
公开(公告)号:CN119205117A
公开(公告)日:2024-12-27
申请号:CN202411216616.2
申请日:2024-08-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06Q40/06 , G06N3/045 , G06F18/25 , G06F18/213 , G06N3/0499
Abstract: 本说明书实施例公开了一种风险识别的方法、装置及电子设备。所述风险识别的方法包括:将特征数据中的连续型数据输入风险识别模型中第一特征子模型,得到连续型特征,所述特征数据为与交易主体的交易风险相关的表格类型的数据,所述第一特征子模型用于在对输入的连续型数据分段后、对连续型数据所属的段的离散值进行特征提取;将所述特征数据中的离散型数据输入所述风险识别模型中第二特征子模型,得到离散型特征;基于所述风险识别模型中融合子模型对所述连续型特征和所述离散型特征进行融合处理,得到风险特征;将所述风险特征输入所述风险识别模型的风险识别子模型,得到用于表征所述交易主体在预设时间内是否会产生交易风险的风险识别结果。
-
公开(公告)号:CN119048241A
公开(公告)日:2024-11-29
申请号:CN202411060108.X
申请日:2024-08-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/06 , G06N3/045 , G06N3/0442 , G06N3/096
Abstract: 本说明书实施例公开了一种针对表格数据的风险识别方法、装置及设备,该方法包括:获取用户在执行目标业务的过程中的表格数据;分别对表格数据中的类别型数据和数值型数据进行特征提取,得到类别型数据对应的类别表征和数值型数据对应的数值表征,基于类别表征和数值表征,确定表格数据对应的数据表征;将表格数据对应的数据表征输入到预先训练的多任务学习网络中,得到包含表格数据对应的多个任务中不同任务之间的关系的每个任务的风险表征,多任务学习网络中包括多个专家模型和任务对应的门控网络;基于每个任务的风险表征,通过预先训练的风险识别网络确定表格数据是否存在预设风险的识别结果。
-
公开(公告)号:CN115456788B
公开(公告)日:2023-03-21
申请号:CN202211387148.6
申请日:2022-11-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种风险群组的检测方法、装置及设备,该方法包括:接收风险群组的检测请求,获取待处理的多个不同用户的目标数据,并对多个不同用户的目标数据进行聚类处理,得到一个或多个由目标数据构成的用户群组,目标数据中包括一种或多种不同的数据特征;基于多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个用户群组和每个用户群组中包含的目标数据,分别确定每个用户群组中包含的用户数量和每种数据特征的数量;基于每种数据特征对应的出现概率,以及每个用户群组中包含的用户数量和每个数据特征的数量,确定每个用户群组中包含的每种数据特征分布的出现概率,进而确定存在预设风险的用户群组。
-
公开(公告)号:CN115456788A
公开(公告)日:2022-12-09
申请号:CN202211387148.6
申请日:2022-11-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种风险群组的检测方法、装置及设备,该方法包括:接收风险群组的检测请求,获取待处理的多个不同用户的目标数据,并对多个不同用户的目标数据进行聚类处理,得到一个或多个由目标数据构成的用户群组,目标数据中包括一种或多种不同的数据特征;基于多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个用户群组和每个用户群组中包含的目标数据,分别确定每个用户群组中包含的用户数量和每种数据特征的数量;基于每种数据特征对应的出现概率,以及每个用户群组中包含的用户数量和每个数据特征的数量,确定每个用户群组中包含的每种数据特征分布的出现概率,进而确定存在预设风险的用户群组。
-
公开(公告)号:CN118568469A
公开(公告)日:2024-08-30
申请号:CN202410712787.8
申请日:2024-06-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/213 , G06F18/241 , G06F18/25 , G06N3/0455 , G06N3/084 , G06F21/62
Abstract: 本说明书公开了一种特征提取方法、装置、介质及设备,将原始用户信息输入编码层,得到用户特征,将用户特征输入解码层,得到混淆用户信息。根据混淆用户信息和原始用户信息确定损失,根据损失至少确定编码层的第一梯度。通过梯度反转层中预设的反转系数,将第一梯度取反,根据取反后的第一梯度,对编码层的参数进行调整。响应于目标用户信息的特征提取请求,将目标用户信息输入训练完成的隐私保护模型中的编码层,确定用户特征并返回。降低了用户特征被解码层逆向还原的概率,减小了用户信息泄露的风险。
-
公开(公告)号:CN117313141A
公开(公告)日:2023-12-29
申请号:CN202311147658.0
申请日:2023-09-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种异常检测方法、装置、设备及可读存储介质,确定在异常检测时刻包含待检测对象的目标拓扑图,根据目标拓扑图中与待检测对象通过边连接的邻居节点、待检测对象以及待检测对象与邻居节点之间的边,确定待检测对象的目标特征,基于待检测对象的目标特征,确定待检测对象在异常检测时刻的异常检测结果。基于在异常检测时刻的目标拓扑图确定待检测对象的目标特征,利用随时间变化的邻居节点的信息,以及随时间变化的待检测对象与邻居节点之间的边的信息,汇总动态变化的图结构和时序信息,从而得到待检测对象在异常检测时刻的异常检测结果,从而基于异常检测结果判断待检测对象是否存在异常,保证了线上业务和隐私数据的安全性。
-
公开(公告)号:CN117113174A
公开(公告)日:2023-11-24
申请号:CN202311008790.3
申请日:2023-08-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/241 , G06F18/214 , G06F18/213 , G06N20/00
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取样本数据,将样本数据输入待训练的机器学习模型,得到样本特征。针对每个样本特征,确定该样本特征的信息量,确定该样本特征与目标任务的相关性,根据各样本特征的信息量以及各样本特征与目标任务的相关性,确定各样本特征的评估值,根据各样本特征的评估值,对各样本特征进行选择,得到最终样本特征。根据最终样本特征,对待训练的机器学习模型进行训练。实现了对机器学习模型的样本特征的选择,使得选取到的样本特征与目标任务相关性高的同时包含的信息量大,减少训练时间,降低机器学习模型对硬件设备计算资源以及存储资源的要求,提高机器学习模型的性能。
-
-
-
-
-
-
-
-
-