一种基于特征选择的模型训练方法、装置以及设备

    公开(公告)号:CN115841016A

    公开(公告)日:2023-03-24

    申请号:CN202211275449.X

    申请日:2022-10-14

    Abstract: 本说明书实施例公开了一种基于特征选择的模型训练方法、装置以及设备。通过获取所述M个任务的共享特征Z;针对第k个任务,根据所述共享特征Z确定特征对于任务的权重向量,根据所述共享特征和所述权重向量确定第k个任务的第一预测结果;针对第i个特征,将所述共享特征Z中的第i行替换为预设值,生成修改后的共享特征,根据所述修改后的共享特征确定第k个任务的第二预测结果;根据所述第一预测结果和所述第二预测结果的差异确定第i个特征对于第k个任务的因果效应因子;确定所述因果效应因子和所述权重向量的差异,根据所述差异生成损失值对所述多任务模型进行训练,从而实现在训练过程中为每个任务选择性地学习具有因果关系的特征。

    训练用户行为预测模型的方法和装置

    公开(公告)号:CN111401963B

    公开(公告)日:2022-06-07

    申请号:CN202010202058.X

    申请日:2020-03-20

    Abstract: 本说明书实施例提供一种训练用户行为预测模型的方法和装置,方法包括:获取多个训练样本,训练样本包括样本特征、第一标签、第二标签和第三标签,第一标签对应主任务,第二标签对应第一辅助任务,第三标签对应第二辅助任务;将各样本特征输入用户行为预测模型,基于主任务的预测输出和第一标签,第一辅助任务的预测输出和第二标签,第二辅助任务的预测输出和第三标签,采用多任务学习的方式训练用户行为预测模型;其中,主任务用于预测用户点击目标对象后发生预设行为的概率,第一辅助任务用于预测用户点击目标对象的概率,第二辅助任务用于预测用户点击目标对象并发生预设行为的概率。训练后的模型预测准确率高。

    网络模型的训练方法、推荐方法、系统

    公开(公告)号:CN119538984A

    公开(公告)日:2025-02-28

    申请号:CN202411659120.2

    申请日:2024-11-19

    Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。

    物品推荐方法和系统
    8.
    发明公开

    公开(公告)号:CN116128581A

    公开(公告)日:2023-05-16

    申请号:CN202211261153.2

    申请日:2022-10-14

    Abstract: 本说明书提供的物品推荐方法和系统,在获取目标物品的属性信息和用户交互信息后,在属性信息中提取出相似性特征,得到显式相似性特征,并基于用户交互信息,确定与目标物品相似的至少一个物品,以得到隐式相似性特征,以及基于显式相似性特征和隐式相似性特征,确定目标物品对应的推荐模型的初始化参数,并基于初始化参数,采用推荐模型对目标物品进行推荐;该方案可以提升在冷启动下物品推荐的准确率。

    一种模型的训练方法、装置以及设备

    公开(公告)号:CN115496162A

    公开(公告)日:2022-12-20

    申请号:CN202211259139.9

    申请日:2022-10-14

    Abstract: 本说明书实施例公开了一种模型的训练方法、装置以及设备。通过获取第j层对于训练样本的输出特征xj,生成由M个输出特征所组成的特征矩阵,1≤j≤M;针对第i个任务,根据稀疏矩阵中的第i行与所述输出特征矩阵生成对应该任务的稀疏特征vi,其中,所述稀疏矩阵中包含K*M个可训练的稀疏参数Z;获取所述多任务模型对所述第i个任务的初始预测特征,融合所述初始预测特征和所述稀疏特征vi生成第i个任务的目标预测特征yi;根据所述目标预测特征yi和训练样本的标签的差异确定第i个任务的损失值Li;融合所产生的K个任务的损失值生成总损失值,根据所述总损失值对所述稀疏参数Z进行训练。

    多任务学习模型的预测方法及装置

    公开(公告)号:CN113420879A

    公开(公告)日:2021-09-21

    申请号:CN202110782136.2

    申请日:2021-07-09

    Abstract: 本公开提供了一种多任务学习模型的预测方法及装置,所述方法包括:利用掩码对嵌入向量进行加权,得到加权后的嵌入向量;将加权后的嵌入向量输入第一子网络层和第三子网络层,得到第一子网络层的第一输出向量和第三子网络层的第二输出向量;将第一输出向量和第二输出向量输入第二子网络层进行处理,得到第三输出向量,处理包括利用第二子网络层的中的第一编码变量对第一输出向量进行计算,利用第二子网络层的中的第二编码变量对第二输出向量进行计算,其中第一编码变量指示第一子网络层中神经元与第三子网络层中神经元之间的连接关系,第二编码变量指示第二子网络层中神经元与第三子网络层中神经元之间的连接关系。

Patent Agency Ranking