-
公开(公告)号:CN116347635A
公开(公告)日:2023-06-27
申请号:CN202310427926.8
申请日:2023-04-20
Applicant: 东南大学
IPC: H04W72/543 , G06N3/092 , H04W72/0453
Abstract: 本发明公开了一种基于NOMA和多智能体强化学习NB‑IoT无线资源分配方法,以在基于NOMA技术的多用户NB‑IoT场景下,解决连接密度最大化的问题。考虑更实际的场景,不同用户具有不同的QoS要求以及使用不同的tone类型。与传统的启发式算法不同,本发明首先将功率、资源块分配和NOMA用户配对这一联合优化问题建模为一个马尔可夫决策过程,并采用MAPPO,这一最先进的多智能体强化学习算法进行解决。考虑到存在的无效动作,本发明在神经网络计算各个动作的概率分布的过程中屏蔽无效动作,进而加速收敛。在VScode平台上使用Python3.8.15进行系统级仿真,结果表明MAPPO算法要优于基线算法。