-
公开(公告)号:CN113207129B
公开(公告)日:2022-05-20
申请号:CN202110506184.9
申请日:2021-05-10
Applicant: 重庆邮电大学
IPC: H04W16/10 , H04B17/373 , H04B17/382
Abstract: 本发明涉及一种基于置信区间上界算法与DRL算法的动态频谱接入方法,属于无线通信领域。该方法具体包括:S1:构建分布式动态频谱接入系统模型;S2:构建SUE的累积期望奖励函数;S3:根据历史经验和接入信道的状态动作,得到最优接入策略,以获得最大的累积期望奖励;S4:采用深度强化学习中的DQN算法和置信区间上界算法结合的方法对接入策略进行求解,通过不断迭代获得最优接入策略。本发明在信道动态变化规律未知的情况下,可以获得近乎信道状态转移规律已知情况下所对应的最优动态频谱接入策略。
-
公开(公告)号:CN113207129A
公开(公告)日:2021-08-03
申请号:CN202110506184.9
申请日:2021-05-10
Applicant: 重庆邮电大学
IPC: H04W16/10 , H04B17/373 , H04B17/382
Abstract: 本发明涉及一种基于置信区间上界算法与DRL算法的动态频谱接入方法,属于无线通信领域。该方法具体包括:S1:构建分布式动态频谱接入系统模型;S2:构建SUE的累积期望奖励函数;S3:根据历史经验和接入信道的状态动作,得到最优接入策略,以获得最大的累积期望奖励;S4:采用深度强化学习中的DQN算法和置信区间上界算法结合的方法对接入策略进行求解,通过不断迭代获得最优接入策略。本发明在信道动态变化规律未知的情况下,可以获得近乎信道状态转移规律已知情况下所对应的最优动态频谱接入策略。
-