-
公开(公告)号:CN111340102B
公开(公告)日:2022-03-01
申请号:CN202010112949.6
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种评估模型解释工具的方法和装置,所述方法基于第一模型和预先获取的用于第一模型的多个第一训练样本进行,包括:从所述多个特征中选取n个特征作为n个选定特征;将每个所述第一训练样本中除所述n个选定特征之外的特征的特征值替换为其它值,以获取多个第二训练样本;使用所述多个第二训练样本训练所述第一模型,以获取具有第一参数组的第一模型;基于所述多个第二训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的重要性排序;确定所述重要性排序的前n个特征相对于所述n个选定特征的查全率,以用于评估所述模型解释工具。
-
公开(公告)号:CN111340356A
公开(公告)日:2020-06-26
申请号:CN202010113648.5
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种评估模型解释工具的方法和装置,所述方法包括:使用所述多个训练样本训练第一模型,以获取具有第一参数组的第一模型,所述第一模型为自解释型模型;基于所述具有第一参数组的第一模型的自解释,获取所述多个特征的第一重要性排序;基于所述多个训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的第二重要性排序;确定所述第二重要性排序中的前n个特征相对于所述第一重要性排序中的前n个特征的第一查全率,以用于评估所述模型解释工具。
-
公开(公告)号:CN111274377A
公开(公告)日:2020-06-12
申请号:CN202010078148.2
申请日:2020-01-23
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 方军鹏
IPC: G06F16/332 , G06F16/35 , G06K9/62 , G06N20/00 , G06Q30/00
Abstract: 本说明书实施例公开了一种训练标记预测模型的方法及系统,所述方法包括:获取多个样本,所述多个样本合计包含M个不同标记,M为≥1的整数;分别除去所述多个样本中每个样本的噪声标记,得到所述多个样本的优化样本集;分别从同一个所述样本的真实标记集和无关标记集中任选一个标记,生成至少一个标记对(x,y);从所述优化样本集中选取训练二分类器的正负样本,训练得到的目标二分类器用于预测所述标记对(x,y)的第一标记x和第二标记y;将P个所述目标二分类器组成标记预测模型,P为生成的不同的所述标记对的个数。
-
公开(公告)号:CN111259339A
公开(公告)日:2020-06-09
申请号:CN202010046887.3
申请日:2020-01-16
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 方军鹏
Abstract: 本说明书实施例公开了一种自动去除样本标记噪声的方法及系统,所述方法包括:获取多个样本,所述多个样本合计包含M个不同标记,M为≥1的整数;初始化所述样本包含所述M个不同标记中任一标记的概率,并基于初始化后的结果构建初始置信度矩阵;基于权重矩阵A迭代更新所述初始置信度矩阵,得到第一置信度矩阵;所述权重矩阵A中元素 代表由所述多个样本中第i个样本与第j个样本之间的相似度确定的第一权重;将权重向量B与所述第一置信度矩阵相乘得到所述样本的第二置信度向量;所述权重向量B中元素代表由所述样本与其他样本的相似度占比确定的第二权重;基于预设条件从所述第二置信度向量中确定所述样本的噪声标记并去除。
-
公开(公告)号:CN118152664A
公开(公告)日:2024-06-07
申请号:CN202410417336.1
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9536 , G06Q30/0207 , G06F18/25 , G06F18/22 , G06F18/24 , G06N3/08 , G06N3/04
Abstract: 本说明书实施例提供一种权益推送模型的数据预处理方法及装置,以及确定权益推送策略的方法及装置,通过用户塔网络和权益塔网络的双塔网络模型,一方面,在用户塔网络中按照根据预定推送偏好信息划分的用户类别设置处理单元,另一方面,在权益塔网络中,按照权益类别设置处理单元,最终将用户塔网络得到的用户表征向量和权益塔网络得到的权益表征向量进行匹配,以实现在预定人工策略下向用户的无偏权益推送策略确定,从而提高包含预定策略的干扰因子的情况下的权益推送准确度。
-
公开(公告)号:CN111177507B
公开(公告)日:2023-06-23
申请号:CN201911421935.6
申请日:2019-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/906 , G06Q30/016 , G06Q30/0601
Abstract: 本说明书实施例提供了针对业务模型新型数据预处理的方法,可以从多标记的训练样本中筛选出二分类的业务模型相关的初始样本,并利用针对多个类别提取的初始特征对这些初始样本进行特征重构,充分挖掘特征与特征之间、特征与属性类别之间的相关性,从而选择出针对当前二分类模型而言,更加准确的基准特征。当重构的基准特征和正/负样本本来的类别标签组合构成新的样本时,可以训练出更加有效的二分类的业务模型。进一步地,在进行多标记业务处理过程中,可以对业务数据同一提取初始特征,保持了特征的一致性,再由各个二分类的业务模型对初始特征进行转换,从而提供更有效的多标记业务处理结果。
-
公开(公告)号:CN115964633A
公开(公告)日:2023-04-14
申请号:CN202211261446.0
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/24 , G06F18/25 , G06N3/0455 , G06N3/09
Abstract: 本说明书实施例公开了一种基于数据增广的模型训练方法、装置以及设备。通过获取训练样本的集合,其中,所述集合中包含有标样本和无标样本;编码生成所述有标样本所对应的第一隐变量,以及,编码生成所述无标样本所对应的第二隐变量;根据所述第一隐变量生成第一分类结果,确定所述第一分类结果与所述有标样本的监督损失值;解码所述第二隐变量生成增广数据,编码所述增广数据生成第三隐变量;根据所述第二隐变量生成第二分类结果,以及,根据所述第三隐变量生成第三分类结果,确定所述第二分类结果和所述第三分类结果的一致性损失值;融合所述监督损失值和一致性损失值对所述模型进行训练,从而实现无需人工数据增广,让模型本身增广数据。
-
公开(公告)号:CN111274376A
公开(公告)日:2020-06-12
申请号:CN202010072725.7
申请日:2020-01-21
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 方军鹏
IPC: G06F16/332 , G06F16/35
Abstract: 本说明书实施例公开了一种训练标记预测模型的方法和系统。所述方法包括:获取多个样本,多个样本合计包含P个不同的标记,P为≥2的整数;从P个不同的标记中任选两个标记,生成(P(P-1))/2个标记对;从多个样本中选取标记对(x,y)对应的第一样本和第二样本;第一样本包含第一标记x,第二样本包含第二标记y;第一样本组成第一样本集,第二样本组成第二样本集;计算选取的样本分别与两个样本集各自中心的距离,将该距离作为所述选取的样本的新特征;基于附加了新特征的选取的样本训练二分类器,得到用于预测所述标记对(x,y)中标记的二分类器,将(P(P-1))/2个二分类器组成标记预测模型。
-
公开(公告)号:CN111274377B
公开(公告)日:2023-06-02
申请号:CN202010078148.2
申请日:2020-01-23
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 方军鹏
IPC: G06F16/332 , G06F16/35 , G06F18/241 , G06Q30/01 , G06N20/00
Abstract: 本说明书实施例公开了一种训练标记预测模型的方法及系统,所述方法包括:获取多个样本,所述多个样本合计包含M个不同标记,M为≥1的整数;分别除去所述多个样本中每个样本的噪声标记,得到所述多个样本的优化样本集;分别从同一个所述样本的真实标记集和无关标记集中任选一个标记,生成至少一个标记对(x,y);从所述优化样本集中选取训练二分类器的正负样本,训练得到的目标二分类器用于预测所述标记对(x,y)的第一标记x和第二标记y;将P个所述目标二分类器组成标记预测模型,P为生成的不同的所述标记对的个数。
-
公开(公告)号:CN111274376B
公开(公告)日:2023-06-02
申请号:CN202010072725.7
申请日:2020-01-21
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 方军鹏
IPC: G06F16/332 , G06F16/35
Abstract: 本说明书实施例公开了一种训练标记预测模型的方法和系统。所述方法包括:获取多个样本,多个样本合计包含P个不同的标记,P为≥2的整数;从P个不同的标记中任选两个标记,生成(P(P‑1))/2个标记对;从多个样本中选取标记对(x,y)对应的第一样本和第二样本;第一样本包含第一标记x,第二样本包含第二标记y;第一样本组成第一样本集,第二样本组成第二样本集;计算选取的样本分别与两个样本集各自中心的距离,将该距离作为所述选取的样本的新特征;基于附加了新特征的选取的样本训练二分类器,得到用于预测所述标记对(x,y)中标记的二分类器,将(P(P‑1))/2个二分类器组成标记预测模型。
-
-
-
-
-
-
-
-
-