-
公开(公告)号:CN113408582B
公开(公告)日:2023-08-29
申请号:CN202110534948.5
申请日:2021-05-17
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/214
Abstract: 本说明书实施例提供一种特征评估模型的训练方法及装置,在特征评估模型的训练方法中,获取初始样本集,其中包括N个具有D维特征的业务对象样本。采用特征重要度评估算法,基于初始样本集,确定D维特征各自的初始重要度,并将其作为D维特征各自的标注标签。对于D维特征中的每项特征,根据对应的统计信息,确定该特征的元特征。将D维特征中多项特征各自的元特征输入特征评估模型,得到多项特征各自的预测重要度。根据多项特征的真实相对排序以及预测重要度,调整特征评估模型的参数,其中该真实相对排序根据多项特征各自的标注标签而确定。
-
公开(公告)号:CN113408582A
公开(公告)日:2021-09-17
申请号:CN202110534948.5
申请日:2021-05-17
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06K9/62
Abstract: 本说明书实施例提供一种特征评估模型的训练方法及装置,在特征评估模型的训练方法中,获取初始样本集,其中包括N个具有D维特征的业务对象样本。采用特征重要度评估算法,基于初始样本集,确定D维特征各自的初始重要度,并将其作为D维特征各自的标注标签。对于D维特征中的每项特征,根据对应的统计信息,确定该特征的元特征。将D维特征中多项特征各自的元特征输入特征评估模型,得到多项特征各自的预测重要度。根据多项特征的真实相对排序以及预测重要度,调整特征评估模型的参数,其中该真实相对排序根据多项特征各自的标注标签而确定。
-
公开(公告)号:CN117764198A
公开(公告)日:2024-03-26
申请号:CN202311647790.8
申请日:2023-12-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/25 , G06F18/214
Abstract: 本说明书实施例披露一种自然语言处理模型的训练方法及装置、预测模型的训练方法及装置。其中自然语言处理模型的训练方法所涉及多轮次迭代训练中的任一轮次包括:首先,基于本轮使用的一批次自然语言样本,确定所述自然语言处理模型在本轮训练中的本轮梯度数据;接着,基于所述本轮梯度数据,以及在上一轮训练中的上一轮梯度数据,确定梯度差异数据,并根据所述梯度差异数据确定预处理矩阵;然后,根据所述预处理矩阵和所述本轮梯度数据,确定参数调整量;之后,利用所述自然语言处理模型的当前模型参数和所述参数调整量,确定本轮更新后的模型参数。如此,可以加快自然语言处理模型的训练收敛速度,提高模型的泛化性能。
-
公开(公告)号:CN115238780A
公开(公告)日:2022-10-25
申请号:CN202210815876.6
申请日:2022-07-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供一种生成业务规则集的方法及装置。所述方法包括:获取第一业务数据样本集;根据所述第一业务数据样本集,训练生成初始业务规则集,所述初始业务规则集包括多个业务规则子集,所述多个业务规则子集分别满足多个评估指标,所述多个评估指标中的每个评估指标均基于多个业务指标确定,且在所述多个评估指标中的不同评估指标中,所述多个业务指标的权重不同;对所述初始业务规则集进行组合优化,以从所述初始业务规则集中选择目标规则集。
-
公开(公告)号:CN113424207B
公开(公告)日:2022-05-17
申请号:CN202080012634.2
申请日:2020-10-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 描述了用于训练可解释机器学习模型的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。一种示例性方法包括:通过多次无替换采样来从多个历史数据记录获得多个训练数据集,所述多个训练数据集包括具有一个或多个重叠的历史数据记录的第一训练数据集和第二训练数据集;生成分别与所述多个训练数据集相对应的多个直方图,其中,所述第二训练数据集的直方图重用所述第一训练数据集的直方图中与所述一个或多个重叠的历史数据记录相对应的一个或多个数据点;基于所述多个直方图,来训练与所述一个或多个用户特征相对应的一个或多个机器学习模型;以及基于所述一个或多个机器学习模型来提供个性化。
-
公开(公告)号:CN116882478A
公开(公告)日:2023-10-13
申请号:CN202310882168.9
申请日:2023-07-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例披露一种图像处理模型的训练方法及装置,一种预测模型的训练方法及装置。其中图像处理模型的训练方法涉及的任一轮次迭代训练包括:先利用当前批次图像样本,确定图像处理模型在其当前的第一模型参数处的第一训练梯度;再基于该第一训练梯度,确定以第一模型参数为中心点且具有预设半径的邻域内,使得当前训练损失发生最大变化的参数变化量;接着,确定图像处理模型在第二模型参数处的第二训练梯度,该第二模型参数基于该第一模型参数偏移该参数变化量而得到;然后,对第一训练梯度,以及第二训练梯度减去该第一训练梯度的梯度差值进行加权求和,得到第三训练梯度;基于预设学习率和该第三训练梯度,更新该第一模型参数。
-
公开(公告)号:CN114764603A
公开(公告)日:2022-07-19
申请号:CN202210493240.4
申请日:2022-05-07
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
Abstract: 本说明书实施例提供一种针对用户分类模型、业务预测模型确定特征的方法及装置,在针对用户分类模型确定特征的方法中,基于各候选表各自的累积分数,从各候选表中选取目标候选表,并从目标候选表中,选取若干目标用户特征。将各目标用户特征添加到第k‑1轮基础表,得到中间基础表。基于中间基础表中的用户特征和用户类别标签,训练当前的用户分类模型。对训练后的用户分类模型进行性能评估,并至少基于得到的第一性能指标值,确定目标候选表的第k轮分数。根据第k轮分数,确定目标候选表的更新的累积分数,以及确定第k轮基础表,以用于下一轮迭代;在多轮迭代后,将最后一轮基础表中的用户特征,作为针对用户分类模型确定的最终用户特征。
-
公开(公告)号:CN114764603B
公开(公告)日:2024-07-02
申请号:CN202210493240.4
申请日:2022-05-07
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/24 , G06F18/214 , G06Q10/0637
Abstract: 本说明书实施例提供一种针对用户分类模型、业务预测模型确定特征的方法及装置,在针对用户分类模型确定特征的方法中,基于各候选表各自的累积分数,从各候选表中选取目标候选表,并从目标候选表中,选取若干目标用户特征。将各目标用户特征添加到第k‑1轮基础表,得到中间基础表。基于中间基础表中的用户特征和用户类别标签,训练当前的用户分类模型。对训练后的用户分类模型进行性能评估,并至少基于得到的第一性能指标值,确定目标候选表的第k轮分数。根据第k轮分数,确定目标候选表的更新的累积分数,以及确定第k轮基础表,以用于下一轮迭代;在多轮迭代后,将最后一轮基础表中的用户特征,作为针对用户分类模型确定的最终用户特征。
-
公开(公告)号:CN113469578B
公开(公告)日:2024-06-21
申请号:CN202110858293.7
申请日:2021-07-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q10/0637 , G06Q10/0631 , G06Q10/10 , G06Q10/04 , G06N20/00
Abstract: 本说明书的实施例提供一种基于多目标学习的业务策略生成方法及业务策略生成装置。在该业务策略生成方法中,获取经过标注后的业务数据样本集,每条业务数据包括至少一个业务特征以及该条业务数据的至少两个标签值。根据经过标注后的业务数据样本集进行基于多目标优化的业务规则训练,构建业务规则集,所述多目标优化中的每个优化目标对应所述业务数据中的一个标签。然后,基于所构建的业务规则集生成业务策略。
-
公开(公告)号:CN113469578A
公开(公告)日:2021-10-01
申请号:CN202110858293.7
申请日:2021-07-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例提供一种基于多目标学习的业务策略生成方法及业务策略生成装置。在该业务策略生成方法中,获取经过标注后的业务数据样本集,每条业务数据包括至少一个业务特征以及该条业务数据的至少两个标签值。根据经过标注后的业务数据样本集进行基于多目标优化的业务规则训练,构建业务规则集,所述多目标优化中的每个优化目标对应所述业务数据中的一个标签。然后,基于所构建的业务规则集生成业务策略。
-
-
-
-
-
-
-
-
-