-
公开(公告)号:CN116248164A
公开(公告)日:2023-06-09
申请号:CN202211624634.5
申请日:2022-12-16
Applicant: 重庆邮电大学
Abstract: 本发明涉及基于深度强化学习的完全分布式路由方法和系统,属于卫星网络动态技术领域。该方法以邻居节点的剩余能量、目的卫星坐标、邻居节点接收队列长度,邻居节点坐标以及当前节点发送队列长度作为状态输入智能决策下一跳,其主要步骤包括:首先,对每颗卫星建立了一个部分可观测的马尔可夫决策过程模型,其中只需要相邻卫星的空间位置、排队状态以及剩余能量。其次,提出了一种基于多智能体深度强化学习的完全分布动态路由方法,推导最优路由策略。