-
公开(公告)号:CN118069248A
公开(公告)日:2024-05-24
申请号:CN202410161353.3
申请日:2024-02-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种业务执行方法、装置、设备及可读存储介质,以获取的各业务对象为节点确定目标拓扑图,获取各业务对象的行为序列,针对目标拓扑图中每个节点,根据该节点的行为序列和该节点的邻居节点的行为序列,确定该节点与该节点的邻居节点之间的关系权重,根据该节点的邻居节点的特征、该节点的邻居节点的行为序列和关系权重,对该节点的特征进行更新,得到该节点的目标特征,根据目标拓扑图中各节点的目标特征执行业务。可见,通过在邻居关系、传播特征提取和节点特征更新进行行为序列和图数据的信息交互和融合,有效地整合了行为序列的特征和图数据的特征,从而提高下游业务的执行效果和数据的隐私安全性。
-
公开(公告)号:CN117251730A
公开(公告)日:2023-12-19
申请号:CN202311176867.8
申请日:2023-09-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/2131 , G06F18/241 , G06N3/0455 , G06Q40/00
Abstract: 本说明书公开了一种风控模型的预训练方法、装置、存储介质及电子设备,在对风控模型进行预训练时,可获取风控样本,将风控样本分别输入待训练的风控模型的各编码端,得到各编码端输出的各编码结果。根据各编码结果和预训练任务,确定各编码端对应的损失,根据确定出的各编码端对应的损失,确定各编码端的损失权重。根据各编码端的损失权重,对各编码端对应的损失进行加权,得到最终损失,根据最终损失,对待训练的风控模型中的各编码端进行训练。在对风控模型进行多任务预训练时,根据每个任务对应的编码端的损失,确定各编码端损失的权重,从而得到最终损失,平衡了训练风控模型时各训练任务的损失收敛速度,使得各训练任务可在相同时刻收敛。
-
公开(公告)号:CN116776114A
公开(公告)日:2023-09-19
申请号:CN202310401375.8
申请日:2023-04-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/213 , G06F18/24 , G06F18/214 , G06Q40/00 , G06F21/62
Abstract: 本说明书公开了一种风险检测的方法、装置、存储介质及电子设备。该风险检测的方法用于隐私保护,包括:获取第一业务数据,确定第一业务数据对应的原始特征,对第一业务数据中部分维度的数据进行掩码处理,得到掩码后数据,通过预设的风控模型的特征提取网络对掩码后数据进行处理,以确定掩码后数据对应的目标特征,将掩码后数据对应的目标特征输入风控模型的特征重构网络,得到重构特征,以最小化原始特征与重构特征之间的偏差为优化目标,至少对风控模型中的特征提取网络进行训练,将训练完成的风控模型进行部署,并在接收到业务请求后,将业务请求对应的目标业务数据输入部署后的风控模型中,以通过风控模型执行风险检测。
-
公开(公告)号:CN116596645A
公开(公告)日:2023-08-15
申请号:CN202310495360.2
申请日:2023-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/00 , G06F18/214 , G06F18/213 , G06F18/24 , G06Q20/40 , G06Q20/38 , G06N20/00
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取源域的第一样本数据,构建与第一样本数据具有相同维度的替换样本数据,第一样本数据不存在标签信息,第一样本数据基于预设的表格数据构建,然后,基于第一样本数据和替换样本数据,通过预设的概率分布函数,生成相应的正负样本对,之后,基于第一样本数据和正负样本对中的样本数据对源域的第一模型进行模型训练,第一模型与目标域的第二模型中包括能够进行参数共享的目标子模型,最终,将训练后的第一模型中的目标子模型的模型参数与第二模型中的目标子模型的模型参数进行参数共享,并在此基础上,通过目标域的第二样本数据对第二模型进行有监督的模型训练。
-
公开(公告)号:CN111402124B
公开(公告)日:2022-05-17
申请号:CN202010213843.5
申请日:2020-03-24
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 赵文龙
Abstract: 本发明实施例提供了一种计算机执行的纹理图像和合成图像的生成方法和装置,生成方法包括:对于待生成图像中任意的第一位置的坐标值施加基础图形函数,得到基础值;针对第一位置,至少根据噪声扰动函数,生成扰动噪声值;对于基础值和扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;根据各个位置的像素值,生成纹理图像。使用该方法大量生成复杂、不重复且低成本的纹理图像,可用于训练图像识别模型。结合这种纹理图像和文本图像可以生成一种合成图像,并且记录合成图像中每个文本的位置信息,将其作为合成图像的文本位置标签数据。以该合成图像作为验证码训练验证码识别模型,有效提高了识别模型的识别能力。
-
公开(公告)号:CN118260713A
公开(公告)日:2024-06-28
申请号:CN202410384289.5
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种多模态数据的融合方法、装置及设备,该方法包括:获取资源交易中风险防控业务的业务数据中包含的多种不同模态的模态数据,多种不同模态的模态数据中包含序列化模态的模态数据和非序列化模态的模态数据,将每种非序列化模态的模态数据分别输入到模态融合模型中的第一模态编码子模型中,得到对应的第一数据表征,获取序列化模态的模态数据对应的输入编码信息,并确定每个第一数据表征插入到输入编码信息中的位置对应的第二位置编码信息,基于每个第一数据表征和相应的第二位置编码信息,以及输入编码信息,生成输入序列编码信息,将输入序列编码信息输入到模态融合模型中的第二模态编码子模型中,得到对应的融合表征。
-
公开(公告)号:CN118070922A
公开(公告)日:2024-05-24
申请号:CN202410276169.3
申请日:2024-03-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取多个不同模态的模态数据,将多个不同模态的模态数据分别输入到表征模型中相应的模态编码器中,得到每种模态的模态数据对应的第一数据表征,基于不同模态的模态数据对应的第一数据表征,通过对比学习的方式和预设的第一损失函数,确定第一损失信息,通过表征模型将不同模态的模态数据对应的第一数据表征进行表征融合处理,并将融合后的数据表征输入表征模型中的表征增强子模型中,基于表征增强子模型的输出结果和多个不同模态的模态数据对应的标签信息,通过预设的第二损失函数,确定第二损失信息,基于第一损失信息和第二损失信息对表征模型进行预训练。
-
公开(公告)号:CN117313141A
公开(公告)日:2023-12-29
申请号:CN202311147658.0
申请日:2023-09-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种异常检测方法、装置、设备及可读存储介质,确定在异常检测时刻包含待检测对象的目标拓扑图,根据目标拓扑图中与待检测对象通过边连接的邻居节点、待检测对象以及待检测对象与邻居节点之间的边,确定待检测对象的目标特征,基于待检测对象的目标特征,确定待检测对象在异常检测时刻的异常检测结果。基于在异常检测时刻的目标拓扑图确定待检测对象的目标特征,利用随时间变化的邻居节点的信息,以及随时间变化的待检测对象与邻居节点之间的边的信息,汇总动态变化的图结构和时序信息,从而得到待检测对象在异常检测时刻的异常检测结果,从而基于异常检测结果判断待检测对象是否存在异常,保证了线上业务和隐私数据的安全性。
-
公开(公告)号:CN117113174A
公开(公告)日:2023-11-24
申请号:CN202311008790.3
申请日:2023-08-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/241 , G06F18/214 , G06F18/213 , G06N20/00
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取样本数据,将样本数据输入待训练的机器学习模型,得到样本特征。针对每个样本特征,确定该样本特征的信息量,确定该样本特征与目标任务的相关性,根据各样本特征的信息量以及各样本特征与目标任务的相关性,确定各样本特征的评估值,根据各样本特征的评估值,对各样本特征进行选择,得到最终样本特征。根据最终样本特征,对待训练的机器学习模型进行训练。实现了对机器学习模型的样本特征的选择,使得选取到的样本特征与目标任务相关性高的同时包含的信息量大,减少训练时间,降低机器学习模型对硬件设备计算资源以及存储资源的要求,提高机器学习模型的性能。
-
公开(公告)号:CN116403034A
公开(公告)日:2023-07-07
申请号:CN202310333647.5
申请日:2023-03-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/774 , G06N3/04 , G06N3/08 , G06Q40/04 , G06Q10/0635
Abstract: 在本说明书提供的图数据模型训练的方法中,根据历史业务记录确定训练样本,通过图数据模型确定训练样本的风险评估值,当训练样本为无标签样本时,根据各无标签样本的风险评估值确定分布;并根据有标签样本的标签,确定所述分布中与所述标签相匹配的区间,以各有标签样本的风险评估值落入与所述标签相匹配的区间为目标,训练所述待训练的图数据模型。从上述方法可以看出,通过利用无标签样本的风险评估值确定分布,再确定有标签样本的风险评估值与所述评估分布的差异,根据所述差异确定损失,利用所述损失训练图数据模型,实现了利用小样本训练图神经网络模型。
-
-
-
-
-
-
-
-
-