-
公开(公告)号:CN117615393A
公开(公告)日:2024-02-27
申请号:CN202311692409.X
申请日:2023-12-11
Applicant: 重庆交通大学
Abstract: 本发明提供了一种基于深度强化学习的STAR‑RIS通信系统的资源优化方法,采用深度强化学习的方式,以最大化合法用户安全速率为目标,在存在非信任能量采集窃听者的情况下,满足基站的最小功率、STAR‑RIS系数矩阵、能量分解等约束要求以及非信任窃听用户的能量收集最低要求,从而最大化合法用户的安全速率。该方法提出基于软更新动作‑评价的深度强化学习算法,综合考虑用户数量、基站天线数量和反射元件数量,引入智能体,以传输和反射系数矩阵和波束赋形矩阵为动作空间,信道状态信息为状态空间,以安全速率为基础,把t步瞬时信道和动作下的安全速率作为奖励,构建强化学习的环境,训练网络从而解决优化问题。采用本方法,可以大幅提高系统的安全速率。