-
公开(公告)号:CN119966873A
公开(公告)日:2025-05-09
申请号:CN202510213322.2
申请日:2025-02-25
Applicant: 桂林电子科技大学
Abstract: 本发明公开一种SDWN中基于多智能体图强化学习的多对多通信路由方法,首先设计了一种基于Q‑learning强化学习算法,优化部署智能体的网络节点数量,从而降低现有方法对所有网络节点部署智能体带来的计算和部署成本;然后在AC框架下的设计了一种集中式训练分布式执行的多智能体深度强化学习算法,为了减少模型训练的存储空间开销分别使用图卷积神经网络和图神经网络重新设计Actor和Critic的网络结构,解决了现有方法中卷积神经网络对拓扑结构数据适应能力比较弱的问题;最后提出动作空间局部观测方法来避免无效动作的生成,从而降低模型训练的时间开销并加快收敛速度,从而降低模型训练的时间开销并加快收敛速度。