-
公开(公告)号:CN111246438A
公开(公告)日:2020-06-05
申请号:CN202010040442.4
申请日:2020-01-15
Applicant: 南京邮电大学
Abstract: 本发明揭示了一种基于强化学习的M2M通信中中继节点的选择方法,包括如下步骤:S1、搭建强化学习模型框架,确定强化学习的动作集、状态集以及奖赏值;S2、对强化学习模型的框架进行细化;S3、根据具体问题对强化学习模型进行迭代循环;S4、根据训练结果对强化学习模型进行调整,应用调整后的强化学习模型进行中继节点的选择。本发明将每次通信的能量消耗情况与为中继节点供能的电池的能量均衡情况都纳入强化学习的目标中,使系统在减少能量消耗与实现能量均衡中达到平衡,避免了能量失衡、延长了整个系统的使用寿命。
-
公开(公告)号:CN111246438B
公开(公告)日:2023-03-24
申请号:CN202010040442.4
申请日:2020-01-15
Applicant: 南京邮电大学
Abstract: 本发明揭示了一种基于强化学习的M2M通信中中继节点的选择方法,包括如下步骤:S1、搭建强化学习模型框架,确定强化学习的动作集、状态集以及奖赏值;S2、对强化学习模型的框架进行细化;S3、根据具体问题对强化学习模型进行迭代循环;S4、根据训练结果对强化学习模型进行调整,应用调整后的强化学习模型进行中继节点的选择。本发明将每次通信的能量消耗情况与为中继节点供能的电池的能量均衡情况都纳入强化学习的目标中,使系统在减少能量消耗与实现能量均衡中达到平衡,避免了能量失衡、延长了整个系统的使用寿命。
-