解释业务处理模型的业务处理结果的方法和装置

    公开(公告)号:CN114548300A

    公开(公告)日:2022-05-27

    申请号:CN202210181701.4

    申请日:2019-12-20

    Inventor: 唐才智

    Abstract: 本说明书实施例提供一种解释业务处理模型的业务处理结果的方法和装置,方法包括:将待解释样本输入预先训练的生成模型,得到第一数目个扰动样本,待解释样本和扰动样本均包含多个特征维度;将待解释样本和第一数目个扰动样本分别输入通过神经网络实现的业务处理模型,输出待解释样本对应的第一业务处理结果,以及各扰动样本分别对应的第二业务处理结果;以第二业务处理结果与第一业务处理结果一致作为筛选条件,从第一数目个扰动样本中筛选出第二数目个扰动样本;统计第二数目个扰动样本与待解释样本在各特征维度上的差异,根据各特征维度上的差异对第一业务处理结果作出解释。能够降低计算复杂度、提高效率。

    为业务数据确定目标特征的方法及装置

    公开(公告)号:CN111461862A

    公开(公告)日:2020-07-28

    申请号:CN202010231996.2

    申请日:2020-03-27

    Inventor: 唐才智

    Abstract: 本说明书实施例提供一种为业务数据确定目标特征的方法和装置,利用分段线性模型作为对业务数据进行处理的业务模型的代理模型,并预先通过业务模型的历史数据处理结果进行训练。针对当前要确定目标特征的业务数据,可以先获取业务模型针对当前的业务数据提取的多个业务特征,然后将多个业务特征输入分段线性模型,从而获取各个隐层分别对应的神经元激活状态,并根据各个隐层分别对应的神经元激活状态以及相应隐层的权重矩阵,确定各个业务特征分别对应的各个重要度系数,接着基于各个重要度系数,从多个业务特征中确定若干目标特征。该实施方式可以为业务模型提供更准确有效的解释。

    评估模型解释工具的方法和装置

    公开(公告)号:CN111340102B

    公开(公告)日:2022-03-01

    申请号:CN202010112949.6

    申请日:2020-02-24

    Inventor: 方军鹏 唐才智

    Abstract: 本说明书实施例提供一种评估模型解释工具的方法和装置,所述方法基于第一模型和预先获取的用于第一模型的多个第一训练样本进行,包括:从所述多个特征中选取n个特征作为n个选定特征;将每个所述第一训练样本中除所述n个选定特征之外的特征的特征值替换为其它值,以获取多个第二训练样本;使用所述多个第二训练样本训练所述第一模型,以获取具有第一参数组的第一模型;基于所述多个第二训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的重要性排序;确定所述重要性排序的前n个特征相对于所述n个选定特征的查全率,以用于评估所述模型解释工具。

    评估模型解释工具的方法和装置

    公开(公告)号:CN111340356A

    公开(公告)日:2020-06-26

    申请号:CN202010113648.5

    申请日:2020-02-24

    Inventor: 方军鹏 唐才智

    Abstract: 本说明书实施例提供了一种评估模型解释工具的方法和装置,所述方法包括:使用所述多个训练样本训练第一模型,以获取具有第一参数组的第一模型,所述第一模型为自解释型模型;基于所述具有第一参数组的第一模型的自解释,获取所述多个特征的第一重要性排序;基于所述多个训练样本和所述第一参数组,通过模型解释工具获取所述多个特征的第二重要性排序;确定所述第二重要性排序中的前n个特征相对于所述第一重要性排序中的前n个特征的第一查全率,以用于评估所述模型解释工具。

    多标记业务处理的方法及装置

    公开(公告)号:CN111177507B

    公开(公告)日:2023-06-23

    申请号:CN201911421935.6

    申请日:2019-12-31

    Inventor: 方军鹏 唐才智

    Abstract: 本说明书实施例提供了针对业务模型新型数据预处理的方法,可以从多标记的训练样本中筛选出二分类的业务模型相关的初始样本,并利用针对多个类别提取的初始特征对这些初始样本进行特征重构,充分挖掘特征与特征之间、特征与属性类别之间的相关性,从而选择出针对当前二分类模型而言,更加准确的基准特征。当重构的基准特征和正/负样本本来的类别标签组合构成新的样本时,可以训练出更加有效的二分类的业务模型。进一步地,在进行多标记业务处理过程中,可以对业务数据同一提取初始特征,保持了特征的一致性,再由各个二分类的业务模型对初始特征进行转换,从而提供更有效的多标记业务处理结果。

    一种基于数据增广的模型训练方法、装置以及设备

    公开(公告)号:CN115964633A

    公开(公告)日:2023-04-14

    申请号:CN202211261446.0

    申请日:2022-10-14

    Inventor: 唐才智 方军鹏

    Abstract: 本说明书实施例公开了一种基于数据增广的模型训练方法、装置以及设备。通过获取训练样本的集合,其中,所述集合中包含有标样本和无标样本;编码生成所述有标样本所对应的第一隐变量,以及,编码生成所述无标样本所对应的第二隐变量;根据所述第一隐变量生成第一分类结果,确定所述第一分类结果与所述有标样本的监督损失值;解码所述第二隐变量生成增广数据,编码所述增广数据生成第三隐变量;根据所述第二隐变量生成第二分类结果,以及,根据所述第三隐变量生成第三分类结果,确定所述第二分类结果和所述第三分类结果的一致性损失值;融合所述监督损失值和一致性损失值对所述模型进行训练,从而实现无需人工数据增广,让模型本身增广数据。

    实体对象分类结果的解释方法和装置

    公开(公告)号:CN111291838A

    公开(公告)日:2020-06-16

    申请号:CN202010384156.X

    申请日:2020-05-09

    Inventor: 唐才智

    Abstract: 说明书披露一种实体对象分类结果的解释方法和装置,所述方法包括:获取输入分类模型的业务数据,以及所述业务数据对应的实体对象的分类结果,所述模型是多层神经网络模型,所述多层神经网络模型隐藏层的激活函数为分段线性激活函数,所述业务数据是所述实体对象的特征数据;针对所述业务数据的每个特征,根据所述分类结果对所述特征求梯度,得到该特征的特征梯度;根据各个特征的特征梯度对所述实体对象的分类结果进行解释。

    解释业务处理模型的业务处理结果的方法和装置

    公开(公告)号:CN114548300B

    公开(公告)日:2024-05-28

    申请号:CN202210181701.4

    申请日:2019-12-20

    Inventor: 唐才智

    Abstract: 本说明书实施例提供一种解释业务处理模型的业务处理结果的方法和装置,方法包括:将待解释样本输入预先训练的生成模型,得到第一数目个扰动样本,待解释样本和扰动样本均包含多个特征维度;将待解释样本和第一数目个扰动样本分别输入通过神经网络实现的业务处理模型,输出待解释样本对应的第一业务处理结果,以及各扰动样本分别对应的第二业务处理结果;以第二业务处理结果与第一业务处理结果一致作为筛选条件,从第一数目个扰动样本中筛选出第二数目个扰动样本;统计第二数目个扰动样本与待解释样本在各特征维度上的差异,根据各特征维度上的差异对第一业务处理结果作出解释。能够降低计算复杂度、提高效率。

    训练因果树的方法及装置、使用因果树预测的方法及装置

    公开(公告)号:CN116933079A

    公开(公告)日:2023-10-24

    申请号:CN202310894564.3

    申请日:2023-07-20

    Inventor: 唐才智

    Abstract: 本说明书实施例提供了训练因果树的方法及装置、使用因果树预测的方法及装置。在训练方法中,在获取对象数据后,按照以下方式对因果树中的各个节点进行分裂处理,直至满足分裂停止条件:针对每个节点,按照以下方式计算当前节点在各个分裂条件对应的损失:在当前节点分裂成多个子节点时,计算每个子节点中的子实验组和子对照组分别在各个时刻对应的预测结果;根据各个干预前时刻的预测结果和实际结果,计算各个子节点对应的干预前损失;根据干预前损失和干预后损失,计算当前节点在当前分裂条件下的损失;以及在得到当前节点在各个分裂条件下对应的损失后,按照损失最小的分裂条件对当前节点进行分裂处理,以得到对应的子节点。

    为业务数据确定目标特征的方法及装置

    公开(公告)号:CN111461862B

    公开(公告)日:2023-06-30

    申请号:CN202010231996.2

    申请日:2020-03-27

    Inventor: 唐才智

    Abstract: 本说明书实施例提供一种为业务数据确定目标特征的方法和装置,利用分段线性模型作为对业务数据进行处理的业务模型的代理模型,并预先通过业务模型的历史数据处理结果进行训练。针对当前要确定目标特征的业务数据,可以先获取业务模型针对当前的业务数据提取的多个业务特征,然后将多个业务特征输入分段线性模型,从而获取各个隐层分别对应的神经元激活状态,并根据各个隐层分别对应的神经元激活状态以及相应隐层的权重矩阵,确定各个业务特征分别对应的各个重要度系数,接着基于各个重要度系数,从多个业务特征中确定若干目标特征。该实施方式可以为业务模型提供更准确有效的解释。

Patent Agency Ranking