-
公开(公告)号:CN115759228A
公开(公告)日:2023-03-07
申请号:CN202211405797.4
申请日:2022-11-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/04 , G06N3/084 , G06Q30/0207 , G06Q10/04 , G06Q10/0631 , G06F18/25
Abstract: 本说明书实施例公开了一种模型训练方法、资源分配方法、装置和计算机设备。所述方法包括:获取若干数量的样本数据,所述样本数据包括用户数据、资源数据以及关系标签,所述关系标签表示用户数据与资源数据是否具有关联关系;统计用户数据的第一分布和资源数据的第二分布;将多个用户数据的第一分布进行融合,将多个资源数据的第二分布进行融合;根据用户数据、资源数据、融合后的第一分布、融合后的第二分布以及关系标签,确定模型的模型参数,所述模型用于预测用户数据与资源数据的关联关系。本说明书实施例可以对样本数据纠偏,提高模型训练效果。
-
公开(公告)号:CN111008898B
公开(公告)日:2020-08-28
申请号:CN202010160591.4
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种评估模型解释工具的方法和装置,所述方法包括:使用多个第一训练样本训练所述第一模型,以获取具有第一参数组的第一模型;基于多个测试样本获取所述具有第一参数组的第一模型的第一性能值;基于多个第一训练样本和所述第一参数组,通过模型解释工具获取多个特征的重要性排序;将每个第一训练样本中除所述重要性排序的前n个特征之外的特征的特征值替换为相同的预定值,以获取多个第二训练样本;使用多个第二训练样本训练所述第一模型,以获取具有第二参数组的第一模型;基于多个测试样本获取具有第二参数组的第一模型的第二性能值;计算第一性能值与所述第二性能值的差异值,以用于评估所述模型解释工具。
-
公开(公告)号:CN111340102A
公开(公告)日:2020-06-26
申请号:CN202010112949.6
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种评估模型解释工具的方法和装置,所述方法基于第一模型和预先获取的用于第一模型的多个第一训练样本进行,包括:从所述多个特征中选取n个特征作为n个选定特征;将每个所述第一训练样本中除所述n个选定特征之外的特征的特征值替换为其它值,以获取多个第二训练样本;使用所述多个第二训练样本训练所述第一模型,以获取具有第一参数组的第一模型;基于所述多个第二训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的重要性排序;确定所述重要性排序的前n个特征相对于所述n个选定特征的查全率,以用于评估所述模型解释工具。
-
公开(公告)号:CN111242319A
公开(公告)日:2020-06-05
申请号:CN202010043115.4
申请日:2020-01-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 说明书披露一种模型预测结果的解释方法和装置。所述方法包括:获取目标模型的输入数据和对应的输入数据预测结果;对所述输入数据进行扰动处理,得到若干扰动数据;将所述若干扰动数据分别输入所述目标模型,得到对应的扰动预测结果;筛选出产生与所述输入数据预测结果不同的扰动预测结果的扰动数据,作为反例扰动数据;根据所述反例扰动数据与所述输入数据的差异,为所述输入数据确定若干解释特征;针对每个解释特征,判断所述输入数据的特征值是否匹配该解释特征的解释条件;将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。
-
公开(公告)号:CN118427615A
公开(公告)日:2024-08-02
申请号:CN202410526264.4
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/2431 , G06F16/9536 , G06F16/9537 , G06Q30/0251 , G06Q30/0601 , H04L67/306 , H04L67/55
Abstract: 本说明书实施例提供一种预测模型的训练方法及装置。该训练方法包括:首先,获取若干真实样本,其中各个真实样本的特征包括用户和对象的真实组合,对应的真实标签指示该真实组合中用户与对象的真实交互;接着,构造若干虚构样本,其中各个虚构样本的特征包括用户和对象的假定组合,对应的伪标签指示该假定组合中用户与对象的预期交互;其中至少一部分虚构样本的伪标签基于预定规则而确定,所述预定规则符合交互概率与用户或对象特征之间的单调性知识;然后,利用所述若干真实样本和若干虚构样本,更新当前预测模型。
-
公开(公告)号:CN111461420A
公开(公告)日:2020-07-28
申请号:CN202010225065.1
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 说明书披露一种模型预测结果的解释方法和装置。所述方法包括:获取目标模型的输入数据和对应的输入数据预测结果;基于所述输入数据和所述目标模型的样本集进行数据增强,生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本;针对每个特征维度,计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度;筛选可分离度满足预定条件的特征作为解释特征;针对每个解释特征,判断所述输入数据的特征值是否匹配该解释特征的解释条件;将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。
-
公开(公告)号:CN111325344A
公开(公告)日:2020-06-23
申请号:CN202010113647.0
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种评估模型解释工具的方法和装置,所述方法包括:使用所述多个训练样本训练第一模型,以获取具有第一参数组的第一模型,所述第一模型为自解释型模型;基于所述具有第一参数组的第一模型的自解释,获取所述多个特征的第一重要性排序;基于所述多个训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的第二重要性排序;确定所述第二重要性排序与所述第一重要性排序的相似度,以用于评估所述模型解释工具。
-
公开(公告)号:CN111177507A
公开(公告)日:2020-05-19
申请号:CN201911421935.6
申请日:2019-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/906 , G06Q30/00 , G06Q30/06
Abstract: 本说明书实施例提供了针对业务模型新型数据预处理的方法,可以从多标记的训练样本中筛选出二分类的业务模型相关的初始样本,并利用针对多个类别提取的初始特征对这些初始样本进行特征重构,充分挖掘特征与特征之间、特征与属性类别之间的相关性,从而选择出针对当前二分类模型而言,更加准确的基准特征。当重构的基准特征和正/负样本本来的类别标签组合构成新的样本时,可以训练出更加有效的二分类的业务模型。进一步地,在进行多标记业务处理过程中,可以对业务数据同一提取初始特征,保持了特征的一致性,再由各个二分类的业务模型对初始特征进行转换,从而提供更有效的多标记业务处理结果。
-
公开(公告)号:CN111008898A
公开(公告)日:2020-04-14
申请号:CN202010160591.4
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种评估模型解释工具的方法和装置,所述方法包括:使用多个第一训练样本训练所述第一模型,以获取具有第一参数组的第一模型;基于多个测试样本获取所述具有第一参数组的第一模型的第一性能值;基于多个第一训练样本和所述第一参数组,通过模型解释工具获取多个特征的重要性排序;将每个第一训练样本中除所述重要性排序的前n个特征之外的特征的特征值替换为相同的预定值,以获取多个第二训练样本;使用多个第二训练样本训练所述第一模型,以获取具有第二参数组的第一模型;基于多个测试样本获取具有第二参数组的第一模型的第二性能值;计算第一性能值与所述第二性能值的差异值,以用于评估所述模型解释工具。
-
-
-
-
-
-
-
-