一种基于深度强化学习的无线通信智能反射面配置方法

    公开(公告)号:CN119136223A

    公开(公告)日:2024-12-13

    申请号:CN202411219169.6

    申请日:2024-09-02

    Abstract: 本发明属于无线通信领域,涉及一种基于深度强化学习的无线通信智能反射面配置方法,包括:构建系统模型,所述系统模型包括:智能反射面IRS、基站BS及其相关联的移动用户UE;根据系统模型以最大化UE的总传输速率为目标构建优化问题;利用∈‑Greedy策略改进DDQN,得改进的DDQN;将优化问题转换为马尔可夫过程,基于马尔可夫过程采用改进的DDQN求解优化问题,得到智能反射面的反射模式;本发明在DDQN中应用∈‑Greedy策略,并在策略损失中使用阈值函数根据参数∈控制新策略和旧策略之间的变化,并进一步控制优势函数归一化过程,不仅防止了DDQN训练不稳定或性能下降,同时避免了DDQN陷入次优策略。

Patent Agency Ranking