一种基于离散表征强化学习的商品推荐系统

    公开(公告)号:CN117575730A

    公开(公告)日:2024-02-20

    申请号:CN202311531235.9

    申请日:2023-11-16

    Applicant: 南京大学

    Abstract: 本发明公开一种基于离散表征强化学习的商品推荐系统,将商品图像输入卷积神经网络,得到m个向量作为初级表征;初始化N个基底向量,对m个表征向量中的每一个向量,找出与其距离最近的基底向量j,得到商品的离散表征;将商品编码为m维的向量v_i,将用户的历史信息编码为m维的向量s_i,使用v_i和s_i的内积刻画用户对商品的感兴趣程度;使用S4 Layer来建模状态转移函数,输入当前时刻用户信息以及选择的商品,对网络参数进行更新,得到最终的策略网络;对于目标用户,利用训练好的策略网络中;取最大的K个概率值及其对应的商品,推荐给用户。本发明使用强化学习来刻画用户对商品的感兴趣程度,提高推荐准确率。

Patent Agency Ranking