-
公开(公告)号:CN119629697B
公开(公告)日:2025-05-06
申请号:CN202510148120.4
申请日:2025-02-11
Applicant: 北京邮电大学
Abstract: 本发明提供了一种无人集群分布式智能路由的方法、装置和电子设备,属于组网通信的技术领域,该方法中,通过无人集群网络中各智能体(即各网络节点)间的信息共享与动态交换,全面提升智能体对网络状态的感知能力,从而增强路由决策的全局优化能力,使网络在高动态环境下仍能保持高效协同,另外,各节点能够基于自身的历史本地状态向量,结合实时网络变化(即本地状态信息),智能预测未来的网络状态并制定路由转发策略,充分挖掘了历史信息的潜在价值,大幅提升了节点在复杂网络环境中进行路由决策的准确性和前瞻性,此外,上述过程可在当前智能体本地进行上述分布式同步的运算,网络通信的灵活性好、效率高。
-
公开(公告)号:CN114202066A
公开(公告)日:2022-03-18
申请号:CN202210154404.0
申请日:2022-02-21
Applicant: 北京邮电大学 , 北京天弛网络有限公司
Abstract: 本申请提供了一种网络控制方法、装置、电子设备及存储介质,涉及计算机网络技术领域,具体为:获取当前时刻的细粒度的数据平面的网络状态;利用存储本地网络环境历史数据的经验库和第二宽度学习网络,对第一宽度学习网络进行在线训练;利用在线训练完成第一宽度学习网络对当前时刻的网络状态进行处理,得到当前时刻的网络状态对应的最优执行动作;将当前时刻的最优执行动作封装为控制规则数据包,然后下发所述控制规则数据包。通过在线训练第一宽度学习网络,能够实时响应网络变化,快速地应对网络突发状况。
-
公开(公告)号:CN119629697A
公开(公告)日:2025-03-14
申请号:CN202510148120.4
申请日:2025-02-11
Applicant: 北京邮电大学
Abstract: 本发明提供了一种无人集群分布式智能路由的方法、装置和电子设备,属于组网通信的技术领域,该方法中,通过无人集群网络中各智能体(即各网络节点)间的信息共享与动态交换,全面提升智能体对网络状态的感知能力,从而增强路由决策的全局优化能力,使网络在高动态环境下仍能保持高效协同,另外,各节点能够基于自身的历史本地状态向量,结合实时网络变化(即本地状态信息),智能预测未来的网络状态并制定路由转发策略,充分挖掘了历史信息的潜在价值,大幅提升了节点在复杂网络环境中进行路由决策的准确性和前瞻性,此外,上述过程可在当前智能体本地进行上述分布式同步的运算,网络通信的灵活性好、效率高。
-
公开(公告)号:CN113645589A
公开(公告)日:2021-11-12
申请号:CN202110774836.7
申请日:2021-07-09
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于反事实策略梯度的无人机集群路由计算方法,包括采用一种COMA动态自适应的强化学习算法,所述COMA算法采用了“集中式训练‑分布式执行”的混合架构。能够有效针对网络节点动态性高、网内流量波动性大的路由场景,COMA算法能够在网络平均生存时间与数据包传输成功率之间形成有效的权衡,进而实现高效而稳定的智能路由策略;能够更好地动态调正路由策略,实现对网络状态的全局最优响应。关于数据包将所选择的区域中的任意一个随机节点作为下一跳传输节点的设计,该设计不仅解决了多智能体环境下动作空间较大的问题,还提高了算法的稳定性,一定程度上减少了节点移动性对训练造成的干扰。
-
公开(公告)号:CN113315715A
公开(公告)日:2021-08-27
申请号:CN202110370309.X
申请日:2021-04-07
Applicant: 北京邮电大学
IPC: H04L12/801
Abstract: 本发明涉及一种基于QMIX的分布式网内拥塞控制方法,本发明通过直接将相关方法部署在网内的三层交换机中,进行数据包的调度与拥塞控制来克服上述传统技术的缺点,同时进一步提升了拥塞控制效果。本发明受到近年来,多智能体系统控制领域中的分布式强化学习方法的启发,采用多智能体强化学习方法中的集中式训练,分布式执行的算法框架,将QMIX算法直接在交换机内部实现,在快速响应毫秒级流量波动的同时,又做到了各交换机之间的协调控制,从而达到稳定的全局最优系统状态,进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。
-
公开(公告)号:CN113645589B
公开(公告)日:2024-05-17
申请号:CN202110774836.7
申请日:2021-07-09
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于反事实策略梯度的无人机集群路由计算方法,包括采用一种COMA动态自适应的强化学习算法,所述COMA算法采用了“集中式训练‑分布式执行”的混合架构。能够有效针对网络节点动态性高、网内流量波动性大的路由场景,COMA算法能够在网络平均生存时间与数据包传输成功率之间形成有效的权衡,进而实现高效而稳定的智能路由策略;能够更好地动态调正路由策略,实现对网络状态的全局最优响应。关于数据包将所选择的区域中的任意一个随机节点作为下一跳传输节点的设计,该设计不仅解决了多智能体环境下动作空间较大的问题,还提高了算法的稳定性,一定程度上减少了节点移动性对训练造成的干扰。
-
公开(公告)号:CN113315715B
公开(公告)日:2024-01-05
申请号:CN202110370309.X
申请日:2021-04-07
Applicant: 北京邮电大学
IPC: H04L47/12
Abstract: 本发明涉及一种基于QMIX的分布式网内拥塞控制方法,本发明通过直接将相关方法部署在网内的三层交换机中,进行数据包的调度与拥塞控制来克服上述传统技术的缺点,同时进一步提升了拥塞控制效果。本发明受到近年来,多智能体系统控制领域中的分布式强化学习方法的启发,采用多智能体强化学习方法中的集中式训练,分布式执行的算法框架,将QMIX算法直接在交换机内部实现,在快速响应毫秒级流量波动的同时,又做到了各交换机之间的协调控制,从而达到稳定的全局最优系统状态,进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。(56)对比文件高少华.基于深度强化学习的TCP拥塞控制机制研究.信息科技.2021,(第4期),全文.王亚东;张悦;陈延祥;张宇.命名数据网络中的一种主动拥塞控制机制研究.载人航天.2020,(第01期),全文.肖扬;吴家威;李鉴学;刘军.一种基于深度强化学习的动态路由算法.信息通信技术与政策.2020,(第09期),全文.
-
公开(公告)号:CN114202066B
公开(公告)日:2022-04-26
申请号:CN202210154404.0
申请日:2022-02-21
Applicant: 北京邮电大学 , 北京天弛网络有限公司
Abstract: 本申请提供了一种网络控制方法、装置、电子设备及存储介质,涉及计算机网络技术领域,具体为:获取当前时刻的细粒度的数据平面的网络状态;利用存储本地网络环境历史数据的经验库和第二宽度学习网络,对第一宽度学习网络进行在线训练;利用在线训练完成第一宽度学习网络对当前时刻的网络状态进行处理,得到当前时刻的网络状态对应的最优执行动作;将当前时刻的最优执行动作封装为控制规则数据包,然后下发所述控制规则数据包。通过在线训练第一宽度学习网络,能够实时响应网络变化,快速地应对网络突发状况。
-
-
-
-
-
-
-