基于多智能体深度强化学习的智能跨域组播路由方法

    公开(公告)号:CN119967538A

    公开(公告)日:2025-05-09

    申请号:CN202510136753.3

    申请日:2025-02-07

    Abstract: 本发明公开一种基于多智能体深度强化学习的智能跨域组播路由方法,利用多控制器通信机制和组播组管理模块分别实现SDWN不同控制域之间网络信息的传递和同步,以及对跨域组播组成员的发现和有效管理;根据分解得到的域间组播树和域内组播树问题的问题特点分别设计了相应的动作策略,以提高智能体的探索效率,并对智能体所采取的不同动作策略设计不同的奖励函数,以引导智能体构建出高效的域间和域内组播树;通过对多智能体的协同学习和策略协调来实现跨域组播树的构建和优化,采用完全去中心化的求解范式以提高多智能体协作的稳定性,同时设计了离线和在线相结合的训练方式,减少了与环境的交互频率和对实时环境的依赖,有效提升多智能体的收敛速度。

    SDWN中基于多智能体图强化学习的多对多通信路由方法

    公开(公告)号:CN119966873A

    公开(公告)日:2025-05-09

    申请号:CN202510213322.2

    申请日:2025-02-25

    Abstract: 本发明公开一种SDWN中基于多智能体图强化学习的多对多通信路由方法,首先设计了一种基于Q‑learning强化学习算法,优化部署智能体的网络节点数量,从而降低现有方法对所有网络节点部署智能体带来的计算和部署成本;然后在AC框架下的设计了一种集中式训练分布式执行的多智能体深度强化学习算法,为了减少模型训练的存储空间开销分别使用图卷积神经网络和图神经网络重新设计Actor和Critic的网络结构,解决了现有方法中卷积神经网络对拓扑结构数据适应能力比较弱的问题;最后提出动作空间局部观测方法来避免无效动作的生成,从而降低模型训练的时间开销并加快收敛速度,从而降低模型训练的时间开销并加快收敛速度。

Patent Agency Ranking