用于训练用户行为表征模型、预测用户行为的方法和装置

    公开(公告)号:CN117407714A

    公开(公告)日:2024-01-16

    申请号:CN202311370158.3

    申请日:2023-10-20

    Abstract: 本说明书的实施例提供了一种用于训练用户行为表征模型的方法和装置。在该用于训练用户行为表征模型的方法中,针对当前训练样本集中的各个当前训练样本,将当前训练样本的、作为样本输入部分的预定期间内的用户历史行为序列提供给当前用户行为表征模型,得到对应的用户行为序列表征向量;再将所得到的用户行为序列表征向量提供给当前行为分布预测模型,得到对应的用户行为分布预测结果;再根据所得到的用户行为分布预测结果与对应的、作为标签部分的后续历史行为序列所指示的行为分布之间的差异,确定预测损失值;在不满足训练结束条件的情况下,根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数。

    模型训练、信息推荐方法和装置
    4.
    发明公开

    公开(公告)号:CN117370652A

    公开(公告)日:2024-01-09

    申请号:CN202311303448.6

    申请日:2023-10-08

    Abstract: 本说明书的实施例提供了一种模型训练、信息推荐方法和装置。在该模型训练方法中,通过在训练过程中引入样本分组模型和权重计算模型,根据当前训练样本经过待优化模型的输出和对应的标签确定各个当前训练样本的状态。再分别利用样本分组模型和权重计算模型确定各个当前训练样本所属的分布类别和对应的权重。进而,基于当前训练样本经过待优化模型的输出和对应的标签以及对应的权重确定损失值,以调整待优化模型的模型参数;基于各个当前训练样本所属的分布类别和对应的权重确定相应的奖励值,以调整样本分组模型和权重计算模型的模型参数。

Patent Agency Ranking