一种基于深度强化学习的多中继节点联合优化方法及装置

    公开(公告)号:CN118740235A

    公开(公告)日:2024-10-01

    申请号:CN202410670163.4

    申请日:2024-05-28

    Abstract: 本发明公开了一种基于深度强化学习的多中继节点联合优化方法及装置。该方法在任务节点执行任务逐渐远离指挥中心时,由指挥中心智能体根据其采集到的状态决定中继节点的发出或收回,保持中继链路中适当的节点数量,同时中继节点智能体根据其采集到的状态输出下一步的加速度以优化链路状态,两者相互配合完成对中继链路的优化,使中继链路在保持畅通的情况下获得更高的链路质量和更低的运行能耗,并同时保持较低的节点数量。在训练过程中智能体通过带优先级权重的经验池、延迟更新的目标网络和噪声探索等方式快速收敛并能更灵活有效地完成中继优化的任务。

Patent Agency Ranking