Patent search ap:("南京理工大学") AND inv:"傅凝宁" Page 1

1.

发明授权
一种基于多智能体强化学习的软件定义网络路由方法有权

公开(公告)号：CN113556287B

公开(公告)日：2022-10-14

申请号：CN202110663351.0

申请日：2021-06-15

Applicant: 南京理工大学

Inventor： 李骏 , 林艳 , 张一晋 , 傅凝宁

IPC: H04L45/76 , H04L45/02 , H04L45/30

Abstract: 本发明公开了一种基于多智能体强化学习的软件定义网络路由方法，该方法为：获取当前软件定义网络的参数，初始化各个节点的路由表和先验概率分布；当数据流到达各个节点时，各个节点根据∈贪心算法选择下一跳节点并转发数据流；各个节点完成数据流的转发后计算即时奖励，并且收到下一跳节点反馈的先验概率分布和路由表中的值；各个节点根据Soft Q‑learning算法更新自己的路由表和先验概率分布，并多次训练直到收敛，获得最优策略。本发明适用于软件定义网络中的路由问题，能有效加快路由表的收敛速度，减少网络延时，提高网络的抗干扰和抗攻击的能力。

2.

发明公开
一种基于多智能体强化学习的软件定义网络路由方法有权

公开(公告)号：CN113556287A

公开(公告)日：2021-10-26

申请号：CN202110663351.0

申请日：2021-06-15

Applicant: 南京理工大学

Inventor： 傅凝宁 , 李骏 , 林艳 , 张一晋

IPC: H04L12/751 , H04L12/721 , H04L12/725 , H04L12/733 , H04L12/771

Abstract: 本发明公开了一种基于多智能体强化学习的软件定义网络路由方法，该方法为：获取当前软件定义网络的参数，初始化各个节点的路由表和先验概率分布；当数据流到达各个节点时，各个节点根据∈贪心算法选择下一跳节点并转发数据流；各个节点完成数据流的转发后计算即时奖励，并且收到下一跳节点反馈的先验概率分布和路由表中的值；各个节点根据Soft Q‑learning算法更新自己的路由表和先验概率分布，并多次训练直到收敛，获得最优策略。本发明适用于软件定义网络中的路由问题，能有效加快路由表的收敛速度，减少网络延时，提高网络的抗干扰和抗攻击的能力。

Patent Agency Ranking