-
公开(公告)号:CN113207127A
公开(公告)日:2021-08-03
申请号:CN202110464824.4
申请日:2021-04-27
Applicant: 重庆邮电大学
IPC: H04W16/10 , H04B17/391 , G06N7/00 , G06N3/08 , G06N3/04
Abstract: 本发明涉及一种非正交多址(Non‑Orthogonal Multiple Access,NOMA)系统中基于分层深度强化学习的动态频谱接入方法,属于深度强化学习、NOMA、动态频谱接入、功率控制技术领域,包括以下步骤:S1:构造上行多用户多信道的通信场景;S2:建立信道干扰模型;S3:将通信优先级高的用户优先获得信道使用权,确保接入用户解码成功以及最小化系统丢包数的目标表示为一个优化问题;S4:构建多智能体模型,对S3中优化问题基于马尔可夫决策过程进行建模;S5:采用集中训练分布执行的方式完成策略的更新和执行。本发明提出的方法相较于其它基于AI方法的DSA方案能够获得更快的收敛速度和更低的丢包数,而且连续的发送功率能够获得比离散的发送功率更好的系统性能。
-
公开(公告)号:CN113207127B
公开(公告)日:2022-04-12
申请号:CN202110464824.4
申请日:2021-04-27
Applicant: 重庆邮电大学
IPC: H04W16/10 , H04B17/391 , G06N7/00 , G06N3/08 , G06N3/04
Abstract: 本发明涉及一种非正交多址(Non‑Orthogonal Multiple Access,NOMA)系统中基于分层深度强化学习的动态频谱接入方法,属于深度强化学习、NOMA、动态频谱接入、功率控制技术领域,包括以下步骤:S1:构造上行多用户多信道的通信场景;S2:建立信道干扰模型;S3:将通信优先级高的用户优先获得信道使用权,确保接入用户解码成功以及最小化系统丢包数的目标表示为一个优化问题;S4:构建多智能体模型,对S3中优化问题基于马尔可夫决策过程进行建模;S5:采用集中训练分布执行的方式完成策略的更新和执行。本发明提出的方法相较于其它基于AI方法的DSA方案能够获得更快的收敛速度和更低的丢包数,而且连续的发送功率能够获得比离散的发送功率更好的系统性能。
-