-
公开(公告)号:CN117313824A
公开(公告)日:2023-12-29
申请号:CN202311220864.X
申请日:2023-09-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/09 , G06N3/082 , G06N3/0495 , G06N3/0499 , G06N3/042 , G06Q20/38 , G06Q20/40
Abstract: 本说明书实施例公开了一种数据资产的融合方法、装置及设备,该方法包括:获取来自一种或多种不同数据源的数据资产构成的数据资产集,数据资产集中包括携带有标签信息的数据资产构成的第一数据资产子集;基于第一数据资产子集中携带有标签信息的数据资产和预设的损失函数对目标模型进行有监督的模型训练,得到训练后的目标模型,损失函数是由不变风险最小化损失函数、分布鲁棒优化损失函数和集成蒸馏学习损失函数中的一项或多项构建的损失函数;将数据资产集中的数据资产分别输入到训练后的目标模型中,得到相应的预测结果;基于得到的预测结果确定数据资产集对应的融合数据资产,并将融合数据资产提供给其它场景进行数据应用。
-
公开(公告)号:CN117095420A
公开(公告)日:2023-11-21
申请号:CN202310865101.4
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/418 , G06V30/18 , G06V30/19 , G06V10/80
Abstract: 本说明书实施例公开了一种图像文本匹配方法,包括:对目标交互页面进行预处理,确定目标交互页面中的元素图像和OCR描述文本的初步匹配关系,得到第一图像文本对;通过预设匹配模型的视觉特征提取网络提取第一图像文本对中元素图像的视觉特征;通过匹配模型的文本特征提取网络提取第一图像文本对中OCR描述文本的第一文本特征,并提取预设分类标签的类别描述文本的第二文本特征;通过匹配模型的特征融合模块对视觉特征、第一文本特征和第二文本特征进行特征融合,得到第三文本特征;通过匹配模型的分类器对第三文本特征和视觉特征进行匹配,得到目标交互页面中元素图像和OCR描述文本的匹配关系。相应地,本发明公开了图像文本匹配装置。
-
公开(公告)号:CN115688130B
公开(公告)日:2023-10-20
申请号:CN202211267903.7
申请日:2022-10-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F21/55 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标业务的业务数据,并基于第一风险检测模型和所述业务数据,确定所述业务数据的风险类型,所述第一风险检测模型为基于深度学习算法构建的用于确定业务数据的风险类型的模型;基于扰动数据和所述业务数据的风险类型,对所述业务数据进行攻击,并在对所述业务数据攻击成功的情况下,获取对所述业务数据攻击成功所使用的扰动数据的目标数据量;在所述目标数据量大于预设数据量阈值的情况下,基于所述业务数据的风险类型,确定执行所述目标业务是否存在风险。
-
公开(公告)号:CN116128072B
公开(公告)日:2023-08-25
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN116152933A
公开(公告)日:2023-05-23
申请号:CN202211600732.5
申请日:2022-12-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/762 , G06V10/82 , G06N3/09
Abstract: 本说明书公开了一种异常检测模型的训练方法、装置、设备及存储介质,获取真实人脸图像作为正样本,获取合成人脸图像作为负样本,并将各正样本和负样本作为训练样本,通过特征提取层提取各训练样本的样本特征,通过分类层得到各训练样本的检测结果,以及基于各正样本的样本特征确定用于表征正样本的共性的代表特征。再根据各正样本的样本特征和代表特征之间的差异、各负样本的样本特征和代表特征之间的差异,以及各训练样本的检测结果及其标注之间的差异对异常检测模型进行训练。本方法可基于代表特征,学习到准确的特征提取方式,以便于后续准确提取人脸图像的人脸特征来进行准确地异常检测,保证了异常检测的准确性。
-
公开(公告)号:CN116128072A
公开(公告)日:2023-05-16
申请号:CN202310122752.4
申请日:2023-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06V10/774 , G06F18/214
Abstract: 本说明书公开了一种风险控制模型的训练方法、装置、设备及存储介质,针对该风险控制模型的每个模型参数,确定该模型参数在本次迭代过程中的梯度,作为第一梯度,并确定该模型参数在上一次迭代过程中的梯度,作为第二梯度,根据第一梯度和该第二梯度确定该模型参数的步长参数,再根据预设的学习率、步长参数和第一梯度,确定该模型参数对应的参数调整量,以及根据参数调整量对该模型参数进行调整。本方法中的步长参数在第一梯度和第二梯度方向相同时对应的参数值高于第一梯度和第二梯度方向相反时对应的参数值,因而在模型参数出现震荡时,参数调整量会随之减小,避免了由于参数调整量过大导致模型参数出现持续震荡的情况出现,提高了训练效率。
-
公开(公告)号:CN116010792A
公开(公告)日:2023-04-25
申请号:CN202211737623.8
申请日:2022-12-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/21 , G06N20/00 , G06Q10/0635
Abstract: 本说明书实施例提供了一种测试模型鲁棒性的方法和装置,该方法包括:获取多个第一样本,第一样本各自包括依序的多个用户行为,用户行为包括若干行为属性;对多个第一样本分别进行第一处理,得到多个第二样本,其中,对于多个第一样本中包括的第三样本的第一处理包括:从第三样本包括的用户行为的行为属性中,确认出至少一个第一属性;将第一属性设置为第一默认值,第一默认值用于指示第一属性的值缺失,得到第四样本,多个第二样本中包括第四样本;基于多个第一样本,确定第一风险识别模型的第一正确识别率;基于多个第二样本,确定第一风险识别模型的第二正确识别率;根据第一正确识别率和第二正确识别率,确定针对所述第一风险识别模型的第一指标,所述第一指标用于指示所述第一风险识别模型的鲁棒性。
-
公开(公告)号:CN115859110A
公开(公告)日:2023-03-28
申请号:CN202211591784.0
申请日:2022-12-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/23 , G06F16/901 , G06F16/906
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取待处理的目标图,然后,将目标图中的不同节点之间的边的关系信息和每个节点的属性信息输入到预先训练的编码器中,得到目标图中的每个节点对应的隐向量,编码器是通过对历史图样本中的一个或多个节点进行移除得到的子图样本,并使用子图样本,基于确定的局部重构损失信息和/或全局损失信息,对编码器和与编码器对应的解码器进行联合训练后得到,最终,基于目标图中的每个节点对应的隐向量,对目标图中包含的节点进行聚类处理,得到一个或多个不同的聚类类别的节点。
-
公开(公告)号:CN115688130A
公开(公告)日:2023-02-03
申请号:CN202211267903.7
申请日:2022-10-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60 , G06F21/55 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标业务的业务数据,并基于第一风险检测模型和所述业务数据,确定所述业务数据的风险类型,所述第一风险检测模型为基于深度学习算法构建的用于确定业务数据的风险类型的模型;基于扰动数据和所述业务数据的风险类型,对所述业务数据进行攻击,并在对所述业务数据攻击成功的情况下,获取对所述业务数据攻击成功所使用的扰动数据的目标数据量;在所述目标数据量大于预设数据量阈值的情况下,基于所述业务数据的风险类型,确定执行所述目标业务是否存在风险。
-
公开(公告)号:CN115618237A
公开(公告)日:2023-01-17
申请号:CN202211590716.2
申请日:2022-12-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/24
Abstract: 本说明书提供了一种模型训练的方法、装置、存储介质及电子设备。在本说明书提供的模型训练方法中,获取训练样本、样本标签以及打标环境信息;将所述训练样本输入待训练的目标模型中,确定所述目标模型的输出结果;将所述打标环境信息输入置信度网络中,通过所述置信度网络输出所述样本标签的置信度;根据所述样本标签的置信度,调整所述目标模型的输出结果,得到修正结果;以所述修正结果与所述样本标签之间的差异最小为优化目标,对所述目标模型与所述置信度网络进行训练。采用本说明书提供的模型训练方法对模型进行有监督训练时,能够根据样本标签的可信程度对模型的输出结果进行修正,保证模型的训练效果,同时使标签的利用率最大化。
-
-
-
-
-
-
-
-
-