一种基于强化学习的干扰资源分配快速决策方法

    公开(公告)号:CN117377104A

    公开(公告)日:2024-01-09

    申请号:CN202311207358.7

    申请日:2023-09-19

    Inventor: 陆永安 唐洪莹

    Abstract: 本发明涉及一种基于强化学习的干扰资源分配快速决策方法,包括以下步骤:引入干扰持续时间,以整个通信周期下干扰方所消耗的总能量最小为目标,构建系统模型;采用基于强化学习的快速决策干扰算法对所述系统模型进行求解,得到干扰决策和资源分配方案,其中,所述快速决策干扰算法采用全并行结构DQN网络,所述全并行结构DQN网络包括信道子网络和功率‑模式‑时间联合子网络;所述信道子网络用于选择干扰信道,所述功率‑模式‑时间联合子网络用于选择干扰功率、干扰样式以及干扰持续时间;所述信道子网络和功率‑模式‑时间联合子网络能够平行学习。本发明能够更有效的进行干扰和资源分配。

Patent Agency Ranking