-
公开(公告)号:CN116842462A
公开(公告)日:2023-10-03
申请号:CN202310798061.6
申请日:2023-06-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G06N3/04 , G16H70/40 , G06Q30/0601
Abstract: 本说明书实施例公开了一种基于样本模式增广的机器学习模型训练方法及系统,涉及人工智能技术领域,技术要点包括:利用真实样本以及增广样本对目标模型进行一轮以上迭代训练;其中的一轮迭代训练包括:通过目标模型分别处理真实样本和增广样本的特征值,得到对应的第一输出;通过滑动平均模型至少处理增广样本的特征值,得到对应的第二输出;其中,滑动平均模型的模型参数基于两轮以上历史迭代训练中的目标模型的模型参数获得;调整目标模型的模型参数,以减小真实样本对应的第一输出与对应标签之间的差异,同时减小增广样本对应的第一输出与第二输出之间的差异。
-
公开(公告)号:CN116842461A
公开(公告)日:2023-10-03
申请号:CN202310797569.4
申请日:2023-06-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G16H70/40 , G16H10/60 , G16H50/70
Abstract: 本说明书实施例公开了一种基于表征泛化的模型训练方法及系统,其技术要点包括:获取测试组中的第一样本,以及对照组中的第二样本;其中,样本包括特征值及标签;通过因果效应预估模型分别处理第一样本的特征值以及第二样本的特征值,得到对应的中间结果以及效应输出;通过协同分类模型分别处理第一样本以及第二样本对应的中间结果,得到对应的分类输出;所述分类输出反映对应的中间结果属于测试组的概率和/或属于对照组的概率;调整因果效应预估模型的模型参数,以减小效应输出与对应标签之间的差异,同时均衡中间结果属于测试组的概率和属于对照组的概率。
-
公开(公告)号:CN116720543A
公开(公告)日:2023-09-08
申请号:CN202310444964.4
申请日:2023-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/04 , G06N3/08 , G06F18/214 , G06Q10/04
Abstract: 本说明书提供的因果效应评估方法和系统,在获取目标对象的对象数据后,将对象数据输入评估模型,获得目标对象在预设干预措施下的目标因果效应值,该评估模型对对象数据与训练数据之间的分布偏移不敏感,以及输出目标因果效应值;该方案可以针对因果效应直接建模,而且建模后得到的评估模型对对象数据与训练数据之间的分布偏移不敏感,从而就可以将该分布偏移造成的评估结果误差控制在预设范围内,因此,可以提升因果效应评估的准确率。
-
公开(公告)号:CN111445025B
公开(公告)日:2020-12-01
申请号:CN202010537635.0
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 张雅淋
Abstract: 本说明书实施例提供了一种确定业务模型超参数的方法和装置,所述业务模型包括多个超参数,所述方法包括:获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集;使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距;基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。
-
公开(公告)号:CN111340244B
公开(公告)日:2020-09-15
申请号:CN202010413992.6
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 张雅淋
Abstract: 本说明书实施例公开一种预测方法、训练方法、装置、服务器及介质,在所述预测方法中,基于预测模型中的多个预测子模型,得到待预测业务样本的多个业务预测结果,基于预测模型中的模型权重子模型,得到每个预测子模型对待预测业务样本进行预测时所占的权重,根据得到每个预测子模型的权重对每个业务预测结果进行加权,得到待预测业务样本的最终业务预测结果,本方案充分考虑到待预测业务样本本身的特点,使得每个预测子模型的模型权重更加可靠,进而提升了预测模型的预测准确度。
-
公开(公告)号:CN111382846A
公开(公告)日:2020-07-07
申请号:CN202010466496.7
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。
-
公开(公告)号:CN111340244A
公开(公告)日:2020-06-26
申请号:CN202010413992.6
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 张雅淋
Abstract: 本说明书实施例公开一种预测方法、训练方法、装置、服务器及介质,在所述预测方法中,基于预测模型中的多个预测子模型,得到待预测业务样本的多个业务预测结果,基于预测模型中的模型权重子模型,得到每个预测子模型对待预测业务样本进行预测时所占的权重,根据得到每个预测子模型的权重对每个业务预测结果进行加权,得到待预测业务样本的最终业务预测结果,本方案充分考虑到待预测业务样本本身的特点,使得每个预测子模型的模型权重更加可靠,进而提升了预测模型的预测准确度。
-
公开(公告)号:CN110796268A
公开(公告)日:2020-02-14
申请号:CN202010007914.6
申请日:2020-01-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供了一种确定业务处理模型超参数的方法和装置,所述方法包括:基于多个超参数的当前取值空间,获取预定数目个超参数组合;获取业务处理模型的训练样本集和测试样本集;获取与各个超参数组合对应的业务处理模型的性能值;从所述预定数目个超参数组合中确定第一正组合和多个负组合;基于所述第一正组合和多个负组合各自的超参数值,更新所述多个超参数的取值空间,以使得所述多个超参数的更新取值空间中包括所述第一正组合、且不包括所述多个负组合,所述多个超参数的更新取值空间用于确定所述业务处理模型的超参数取值。
-
公开(公告)号:CN118504655A
公开(公告)日:2024-08-16
申请号:CN202410601009.1
申请日:2024-05-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/096 , G06N3/045 , G06F18/22 , G06F18/2415 , G06F18/10
Abstract: 本说明书一个或多个实施例提供一种基于知识蒸馏的模型训练方法及装置,包括:获取样本集以及样本集中每个样本所对应的多源噪声标记组;基于样本集以及各个多源噪声标记组训练教师网络,并根据教师网络在各个标记源视角下分别对各个样本输出的概率值与相应标记源添加的噪声标记之间的相似度,确定各个标记源的可靠程度,可靠程度与相似度呈正相关;根据包含有硬标签损失部分与软标签损失部分的蒸馏损失函数对学生网络进行训练;其中,每一多源噪声标记组中的各个噪声标记参与构建硬标签损失部分的概率,和/或教师网络针对同一样本分别在各个标记源视角下输出的概率值参与构建软标签损失部分的概率,与相应标记源的可靠程度呈正相关。
-
公开(公告)号:CN116468538A
公开(公告)日:2023-07-21
申请号:CN202310364914.5
申请日:2023-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F18/214 , G06N3/04 , G06N5/01 , G06N20/00
Abstract: 本说明书实施例公开了一种风险检测模型训练方法、装置、存储介质及设备。该方法包括:对第一样本数据进行规则学习,得到与第一样本数据对应的风险检测规则,第一样本数据包括未标记样本和标记风险样本,未标记样本的数量大于标记风险样本的数量;基于风险检测规则对第一样本数据中的未标记样本进行标记,得到第二样本数据,第二样本数据包括潜在风险样本、潜在正常样本以及标记风险样本;基于第二样本数据,对风险检测模型进行训练。
-
-
-
-
-
-
-
-
-