-
公开(公告)号:CN117575730A
公开(公告)日:2024-02-20
申请号:CN202311531235.9
申请日:2023-11-16
Applicant: 南京大学
IPC: G06Q30/0601 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开一种基于离散表征强化学习的商品推荐系统,将商品图像输入卷积神经网络,得到m个向量作为初级表征;初始化N个基底向量,对m个表征向量中的每一个向量,找出与其距离最近的基底向量j,得到商品的离散表征;将商品编码为m维的向量v_i,将用户的历史信息编码为m维的向量s_i,使用v_i和s_i的内积刻画用户对商品的感兴趣程度;使用S4 Layer来建模状态转移函数,输入当前时刻用户信息以及选择的商品,对网络参数进行更新,得到最终的策略网络;对于目标用户,利用训练好的策略网络中;取最大的K个概率值及其对应的商品,推荐给用户。本发明使用强化学习来刻画用户对商品的感兴趣程度,提高推荐准确率。