-
公开(公告)号:CN113556287B
公开(公告)日:2022-10-14
申请号:CN202110663351.0
申请日:2021-06-15
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于多智能体强化学习的软件定义网络路由方法,该方法为:获取当前软件定义网络的参数,初始化各个节点的路由表和先验概率分布;当数据流到达各个节点时,各个节点根据∈贪心算法选择下一跳节点并转发数据流;各个节点完成数据流的转发后计算即时奖励,并且收到下一跳节点反馈的先验概率分布和路由表中的值;各个节点根据Soft Q‑learning算法更新自己的路由表和先验概率分布,并多次训练直到收敛,获得最优策略。本发明适用于软件定义网络中的路由问题,能有效加快路由表的收敛速度,减少网络延时,提高网络的抗干扰和抗攻击的能力。
-
公开(公告)号:CN113556287A
公开(公告)日:2021-10-26
申请号:CN202110663351.0
申请日:2021-06-15
Applicant: 南京理工大学
IPC: H04L12/751 , H04L12/721 , H04L12/725 , H04L12/733 , H04L12/771
Abstract: 本发明公开了一种基于多智能体强化学习的软件定义网络路由方法,该方法为:获取当前软件定义网络的参数,初始化各个节点的路由表和先验概率分布;当数据流到达各个节点时,各个节点根据∈贪心算法选择下一跳节点并转发数据流;各个节点完成数据流的转发后计算即时奖励,并且收到下一跳节点反馈的先验概率分布和路由表中的值;各个节点根据Soft Q‑learning算法更新自己的路由表和先验概率分布,并多次训练直到收敛,获得最优策略。本发明适用于软件定义网络中的路由问题,能有效加快路由表的收敛速度,减少网络延时,提高网络的抗干扰和抗攻击的能力。
-