基于相关性的离线强化学习维度缺失动作数据填补方法

    公开(公告)号:CN119416857A

    公开(公告)日:2025-02-11

    申请号:CN202510024529.5

    申请日:2025-01-08

    Applicant: 吉林大学

    Abstract: 本发明公开离线强化学习技术领域的基于相关性的离线强化学习维度缺失动作数据填补方法,具体步骤为:通过智能体与环境交互后,获取到数据集#imgabs0#,对数据集#imgabs1#进行分析,识别存在缺失的维度、构建并训练模型、加载包含维度缺失动作数据的数据集,读取其中的动作数据,将其转换为PyTorch张量,然后加载已预训练完毕的模型,对数据集#imgabs2#中的缺失值进行插补,得到插补后的数据集#imgabs3#以及将得到的数据集#imgabs4#用于训练离线强化学习智能体,本发明有助于提高离线强化学习模型在处理不完整数据时的准确性和鲁棒性,从而增强模型在实际应用中的表现。

    基于用户历史签到序列的城市POI推荐与时间戳预测方法

    公开(公告)号:CN119149834A

    公开(公告)日:2024-12-17

    申请号:CN202411658282.4

    申请日:2024-11-20

    Applicant: 吉林大学

    Abstract: 本发明公开城市推荐技术领域的基于用户历史签到序列的城市POI推荐与时间戳预测方法,具体步骤为:收集用户的历史签到数据,并按照时间顺序对每位用户的签到记录进行排序,形成用户签到序列,随后将数据实时传输至服务器并存储、对数据进行预处理,然后从预处理后的用户签到序列中提取出有效的POI序列和时间戳序列,将POI序列和时间戳序列输入到构建的TAPT模型中,利用TAPT模型中高效的编码器模块和嵌入连接层,将POI嵌入与时间戳嵌入进行融合,形成联合嵌入,最终,联合嵌入输入到POI推荐模型和时间戳预测器中,实现对POI及其对应时间戳的联合预测,克服了现有技术在用户行为建模和时间信息处理方面不足的问题。

Patent Agency Ranking