针对推荐模型训练安全评估模型的方法及装置

    公开(公告)号:CN118332598A

    公开(公告)日:2024-07-12

    申请号:CN202410517218.8

    申请日:2024-04-26

    Abstract: 本说明书实施例涉及针对推荐模型训练安全评估模型的方法及装置,方法包括:获取推荐模型生成的第一推荐项目列表,以及获取第一候选项目集合;基于深度强化学习对智能体进行目标训练,训练完成的智能体作为对推荐模型的安全评估模型;目标训练包括:基于智能体在之前的若干步动作中选择的项目形成第一项目序列,作为第一状态;将第一状态输入智能体,使其从第一候选项目集合中选择第一项目作为第一动作,将第一项目添加到第一项目序列中,形成第二状态;将第二状态对应的第二项目序列输入到推荐模型中,得到第二推荐项目列表;根据第二推荐项目列表与第一推荐项目列表之间的相似度,确定第一回报;至少根据第一回报,更新智能体。

    针对序列推荐模型的安全性评估方法及装置

    公开(公告)号:CN118690387A

    公开(公告)日:2024-09-24

    申请号:CN202410780980.5

    申请日:2024-06-14

    Abstract: 本说明书实施例涉及针对序列推荐模型的安全性评估方法及装置,序列推荐模型用于根据输入项目序列输出针对多个项目的推荐信息;方法包括:首先,获取序列推荐模型的替代模型以及初始序列表征;接下来,对初始序列表征进行多轮更新,得到目标序列表征;任意一轮更新包括:将当前序列表征输入到序列解码器中,得到第一项目序列;使用包含第一项目序列的第一训练集训练替代模型,使其输出接近序列推荐模型的输出;根据第一损失,调整当前序列表征;然后,将目标序列表征输入到序列解码器中,得到目标项目序列,将其添加到目标训练集;获取使用目标训练集更新后的序列推荐模型输出的针对目标项目的目标评分值,以评估序列推荐模型的安全性。

Patent Agency Ranking