增益模型的训练方法及装置

    公开(公告)号:CN114139724B

    公开(公告)日:2024-08-09

    申请号:CN202111447295.3

    申请日:2021-11-30

    Abstract: 本说明书实施例提供一种增益模型的训练方法,包括:先将用户集中任意目标用户的用户特征,分别输入基于有干预用户而训练的第一预测模型、基于无干预用户而训练的第二预测模型和干预倾向预测模型,对应得到该目标用户针对目标行为的第一预测结果,第二预测结果,和该用户是否被干预的干预倾向分数;接着,根据所述第一预测结果、第二预测结果、干预倾向分数,以及该目标用户的行为标签,确定该目标用户响应干预的增益标签,所述增益标签与所述干预倾向分数成线性关系;再基于所述用户集中各个用户的用户特征和增益标签,训练所述增益模型。

    用户表征网络的训练方法及装置

    公开(公告)号:CN113988291B

    公开(公告)日:2024-06-04

    申请号:CN202111250535.0

    申请日:2021-10-26

    Abstract: 本说明书实施例提供一种用户表征网络的训练方法,包括:将无偏样本的用户特征输入经过预训练的第一用户表征网络,得到第一用户表征向量,并且,将有偏样本的用户特征输入第二用户表征网络,得到第二用户表征向量,其中无偏样本和有偏样本分别通过向用户发放由随机策略和非随机策略确定的权益份额而采集;将得到的两个用户表征向量分别输入判别器,得到对应两个判别结果;以最小化目标函数的函数值为目标,训练判别器,该函数值与第一损失和第二损失正相关,第一损失基于无偏样本对应的判别结果和无偏标识而确定,第二损失基于有偏样本对应的判别结果和有偏标识而确定;以最大化目标函数的函数值为目标,对第二用户表征网络进行训练。

    增益模型的训练方法及装置

    公开(公告)号:CN114139724A

    公开(公告)日:2022-03-04

    申请号:CN202111447295.3

    申请日:2021-11-30

    Abstract: 本说明书实施例提供一种增益模型的训练方法,包括:先将用户集中任意目标用户的用户特征,分别输入基于有干预用户而训练的第一预测模型、基于无干预用户而训练的第二预测模型和干预倾向预测模型,对应得到该目标用户针对目标行为的第一预测结果,第二预测结果,和该用户是否被干预的干预倾向分数;接着,根据所述第一预测结果、第二预测结果、干预倾向分数,以及该目标用户的行为标签,确定该目标用户响应干预的增益标签,所述增益标签与所述干预倾向分数成线性关系;再基于所述用户集中各个用户的用户特征和增益标签,训练所述增益模型。

    用户表征网络的训练方法及装置
    4.
    发明公开

    公开(公告)号:CN113988291A

    公开(公告)日:2022-01-28

    申请号:CN202111250535.0

    申请日:2021-10-26

    Abstract: 本说明书实施例提供一种用户表征网络的训练方法,包括:将无偏样本的用户特征输入经过预训练的第一用户表征网络,得到第一用户表征向量,并且,将有偏样本的用户特征输入第二用户表征网络,得到第二用户表征向量,其中无偏样本和有偏样本分别通过向用户发放由随机策略和非随机策略确定的权益份额而采集;将得到的两个用户表征向量分别输入判别器,得到对应两个判别结果;以最小化目标函数的函数值为目标,训练判别器,该函数值与第一损失和第二损失正相关,第一损失基于无偏样本对应的判别结果和无偏标识而确定,第二损失基于有偏样本对应的判别结果和有偏标识而确定;以最大化目标函数的函数值为目标,对第二用户表征网络进行训练。

Patent Agency Ranking