基于迁移学习的训练神经网络模型的方法和装置

    公开(公告)号:CN111382846B

    公开(公告)日:2020-09-01

    申请号:CN202010466496.7

    申请日:2020-05-28

    Inventor: 张雅淋 李龙飞

    Abstract: 本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。

    选择性集成异质模型的实体对象分类方法及相关设备

    公开(公告)号:CN111325291B

    公开(公告)日:2020-08-25

    申请号:CN202010409750.X

    申请日:2020-05-15

    Inventor: 张雅淋

    Abstract: 本说明书一个或多个实施例提供的选择性集成异质模型的实体对象分类系统,提出了针对异质模型选择性集成的解决方案,通过在集成学习中包含异质的基分类器,每一种类型的基分类器在学习阶段都会给予不同的参数组合学习得到多个模型,在选择阶段,对每一类模型,选择其中一个或多个作为最终模型的组成部分。通过这样的方式,能够充分利用不同模型各有所长的特点,做到互补,提升整体模型的鲁棒性和有效性,能够较好地完成实体对象分类。

    选择性集成异质模型的实体对象分类方法及相关设备

    公开(公告)号:CN111325291A

    公开(公告)日:2020-06-23

    申请号:CN202010409750.X

    申请日:2020-05-15

    Inventor: 张雅淋

    Abstract: 本说明书一个或多个实施例提供的选择性集成异质模型的实体对象分类系统,提出了针对异质模型选择性集成的解决方案,通过在集成学习中包含异质的基分类器,每一种类型的基分类器在学习阶段都会给予不同的参数组合学习得到多个模型,在选择阶段,对每一类模型,选择其中一个或多个作为最终模型的组成部分。通过这样的方式,能够充分利用不同模型各有所长的特点,做到互补,提升整体模型的鲁棒性和有效性,能够较好地完成实体对象分类。

    一种针对多塔神经网络的模型训练方法及装置

    公开(公告)号:CN118917379A

    公开(公告)日:2024-11-08

    申请号:CN202410918883.8

    申请日:2024-07-09

    Abstract: 本说明书一个或多个实施例提供一种针对多塔神经网络的模型训练方法及装置,包括:基于获取的样本集以及样本集中每个样本所对应的多源噪声标记组,通过第一损失函数对多塔神经网络进行第一阶段训练;确定每一样本分别对应于各个标记源视角的多源聚合输出概率;基于由第一损失函数与第二损失函数构建的目标损失函数对多塔神经网络进行第二阶段训练;第二损失函数为多塔神经网络在每一标记源视角下分别对样本集中的每一样本输出的概率值与相应样本对应于相应标记源视角的多源聚合输出概率之间的损失的加权平均值,任一标记源视角下对任一样本对应的损失的权重与多塔神经网络在该标记源视角下对该样本的认知的可靠程度呈负相关。

    一种模型的元学习方法、装置以及设备

    公开(公告)号:CN115861681A

    公开(公告)日:2023-03-28

    申请号:CN202211422452.X

    申请日:2022-11-14

    Abstract: 本说明书实施例公开了一种模型的元学习方法、装置以及设备。方案包括通过获取包含M个样本的集合;针对第i个样本Si,生成对应于所述训练样本的嵌入向量φi和中间特征图ηi;根据所产生的M个嵌入向量的平均值τc生成维度注意力图Md,和,根据所产生的M个中间特征图的平均值τη生成区域注意力图Mr;融合所述嵌入向量φi和维度注意力图Md生成维度特征向量φi’,以及,融合所述第i个样本的中间特征图ηi和所述区域注意力图Mr生成区域特征图ηi’;根据所述维度特征向量φi’和所述区域特征图ηi’进行训练。从而实现在元学习中,通过从维度和区域这两个不同的角度上来精确定位任务所需要的特征,减少无关特征的干扰。

    一种业务模型训练方法和装置

    公开(公告)号:CN112348099A

    公开(公告)日:2021-02-09

    申请号:CN202011264909.X

    申请日:2020-06-19

    Inventor: 张雅淋

    Abstract: 本说明书实施例提供了一种业务模型训练方法和装置,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

    预估资源使用份额的神经网络模型的训练方法和装置

    公开(公告)号:CN110909878A

    公开(公告)日:2020-03-24

    申请号:CN201911214674.0

    申请日:2019-12-02

    Inventor: 张雅淋

    Abstract: 本说明书实施例提供一种预估资源使用份额的神经网络模型的训练方法和装置,方法包括:获取多组训练样本,包括用户的特征信息、第一标签和第二标签,第一标签用于指示该用户在第一时间周期内的资源使用份额,第二标签用于指示该用户在第一时间周期内是否使用了资源;针对各组训练样本中的用户的特征信息,利用神经网络模型得到资源使用份额预估值和资源使用概率预估值;根据资源使用份额预估值、第一标签和第一损失函数,确定第一损失;根据资源使用概率预估值、第二标签和第二损失函数,确定第二损失;对第一损失和第二损失加权求和,得到总损失;以最小化总损失为目标,对神经网络模型进行训练。能够提高预估资源使用份额的准确性。

    一种用户样本的筛选方法及装置
    18.
    发明公开

    公开(公告)号:CN119782807A

    公开(公告)日:2025-04-08

    申请号:CN202411775767.1

    申请日:2024-12-04

    Abstract: 本说明书实施例提供了一种用户样本的筛选方法及装置。第一训练集中包含多个用户样本,每一个用户样本具有多套风险标签。针对任意的第一用户样本,获取第一用户样本的多套风险标签分别对应的损失值,多个损失值从对第一神经网络的训练过程中得到。接着,从第一用户样本的多个损失值对应的第一融合损失中扣除第一值,得到修正损失。其中,第一值利用多个损失值的分布特征确定,用于体现由第一神经网络包含的误差而导致增大的损失值。在得到若干用户样本的修正损失时,基于该修正损失从第一训练集中筛选用户样本及其风险标签,并加入第三训练集。用户样本中包含隐私数据,在数据处理过程中需要进行隐私保护。

    一种评估业务模型超参数的方法和装置

    公开(公告)号:CN111539536B

    公开(公告)日:2020-10-23

    申请号:CN202010566084.0

    申请日:2020-06-19

    Inventor: 张雅淋 李龙飞

    Abstract: 本说明书实施例提供了一种评估业务模型超参数的方法和装置,所述方法包括:获取业务模型的多个第一超参数组合及其各自的分数、和待评估的第二超参数组合,所述第一超参数组合的分数为其对应的业务模型的性能分数;计算所述第二超参数组合与各个第一超参数组合的相似度;计算所述多个分数的加权和,作为所述第二超参数组合的估计分数,其中,各个所述第一超参数组合的分数的权重基于相应的所述相似度确定。

Patent Agency Ranking