-
公开(公告)号:CN118740235A
公开(公告)日:2024-10-01
申请号:CN202410670163.4
申请日:2024-05-28
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于深度强化学习的多中继节点联合优化方法及装置。该方法在任务节点执行任务逐渐远离指挥中心时,由指挥中心智能体根据其采集到的状态决定中继节点的发出或收回,保持中继链路中适当的节点数量,同时中继节点智能体根据其采集到的状态输出下一步的加速度以优化链路状态,两者相互配合完成对中继链路的优化,使中继链路在保持畅通的情况下获得更高的链路质量和更低的运行能耗,并同时保持较低的节点数量。在训练过程中智能体通过带优先级权重的经验池、延迟更新的目标网络和噪声探索等方式快速收敛并能更灵活有效地完成中继优化的任务。
-
公开(公告)号:CN118590961A
公开(公告)日:2024-09-03
申请号:CN202410676211.0
申请日:2024-05-28
Applicant: 北京邮电大学
IPC: H04W40/22 , H04W40/20 , H04W4/90 , H04W24/02 , H04W40/12 , H04B7/185 , H04L41/16 , G06N3/092 , G06N3/045
Abstract: 本发明公开了一种基于深度强化学习的通信中继位置优化方法及装置。任务节点在执行任务逐渐远离指挥中心时,状态采集模块持续采集中继节点能够获得的状态信息。中继节点智能体根据其采集到的状态输出节点下一步的加速度优化链路状态,使中继链路在保持畅通的情况下获得更高的链路质量,更低的运行能耗。在训练过程中智能体通过带优先级权重的经验池、延迟更新的目标网络和噪声探索等方式快速收敛并能更灵活有效地完成中继优化的任务。
-