-
公开(公告)号:CN113315715B
公开(公告)日:2024-01-05
申请号:CN202110370309.X
申请日:2021-04-07
Applicant: 北京邮电大学
IPC: H04L47/12
Abstract: 本发明涉及一种基于QMIX的分布式网内拥塞控制方法,本发明通过直接将相关方法部署在网内的三层交换机中,进行数据包的调度与拥塞控制来克服上述传统技术的缺点,同时进一步提升了拥塞控制效果。本发明受到近年来,多智能体系统控制领域中的分布式强化学习方法的启发,采用多智能体强化学习方法中的集中式训练,分布式执行的算法框架,将QMIX算法直接在交换机内部实现,在快速响应毫秒级流量波动的同时,又做到了各交换机之间的协调控制,从而达到稳定的全局最优系统状态,进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。(56)对比文件高少华.基于深度强化学习的TCP拥塞控制机制研究.信息科技.2021,(第4期),全文.王亚东;张悦;陈延祥;张宇.命名数据网络中的一种主动拥塞控制机制研究.载人航天.2020,(第01期),全文.肖扬;吴家威;李鉴学;刘军.一种基于深度强化学习的动态路由算法.信息通信技术与政策.2020,(第09期),全文.
-
公开(公告)号:CN116155819B
公开(公告)日:2023-07-14
申请号:CN202310424468.2
申请日:2023-04-20
Applicant: 北京邮电大学
IPC: H04L47/125 , G06N3/092
Abstract: 本发明提供了一种基于可编程数据平面的智能网内负载均衡方法与装置,涉及通信的技术领域,该方法应用于控制平面,通过获取网络系统中每个交换机的队列深度来实现全局拥塞感知,并利用强化学习算法确定目标交换机的端口转发概率,以辅助决策目标交换机的数据包转发路径。由于强化学习算法的奖励函数值与网络系统中交换机的队列深度差值和平均队列深度成反比,所以能够达到网络中负载均衡效果越差则奖励越少的目的,进而使得智能体输出的动作向减小拥塞、增强负载均衡效果的方向发展。在不对称的网络拓扑环境中仍具备较佳的负载均衡效果,有效地缓解了现有的负载均衡方法负载均衡效果差和普适性差的技术问题。
-
公开(公告)号:CN114189481A
公开(公告)日:2022-03-15
申请号:CN202111409558.1
申请日:2021-11-25
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于深度强化学习的TSN流调度方法,其特征在于,包括消除在TSN交换机处的排队时延来用以完成时延敏感流的无等待传输,其中以对单播时间敏感流进行无等待调度的情况进行处理,TSN能够提供确定性时延、带宽保证等能力,同时降低了成本。时间敏感网络通过全网时钟同步、流量调度以及系统配置三种主要机制来实现确定性低时延保障。同时减少保护带的数量,并且将时间敏感流的传输都压缩在调度表的开始,因此有更多的带宽资源可以用于尽力而为流的传输。
-
公开(公告)号:CN115473561B
公开(公告)日:2023-06-30
申请号:CN202110654258.3
申请日:2021-06-11
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于协作Q学习的分布式卫星网络智能负载均衡方法,包括:所述方法将CollaQ强化学习算法应用于卫星通信,其数据传输过程为:1).地面将数据包发送到卫星,接收卫星将数据包缓存在队列中;2).卫星根据所提出的算法将数据包发送到相邻卫星;3).目的卫星将信息发送回地面上的目的地。每个轨道上分布的卫星数相等,将轨道数定义为m,每个轨道中的卫星数为n。相邻轨道之间的经度差为360°/m,同一轨道中相邻卫星之间的经度差为180°/n。在本发明中CollaQ算法在处理环境中复杂的Agent拓扑时具有良好的收敛性,并且可以很好地应对系统规模的变化。CollaQ的性能要优于DDPG,并且网络中的最大链路利用率相对较小,这意味着它可以更有效地实现负载平衡。
-
公开(公告)号:CN114268586A
公开(公告)日:2022-04-01
申请号:CN202111553279.2
申请日:2021-12-17
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种混合约束的时间敏感网络(TSN)分级流量调度方法,包括:将整个工厂网络自下而上被划分为了现场级、车间级以及工厂级,其中针对级内传输任务和级间传输任务设置不同的约束条件,并且放松对级间传输任务的约束进行相关管理,在本发明中,将传统时间敏感网络时间表计算进行了更新,由于改进后较宽松的约束使时间表可行解空间增大,所以产生了降低了交换机队列利用率,使得BE流量可使用队列数增加,从而增加了网络整体的利用率和吞吐量,并且降低了时间表计算复杂度。
-
公开(公告)号:CN114035675A
公开(公告)日:2022-02-11
申请号:CN202111219044.X
申请日:2021-10-20
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于智能集群元语的无人机按需组网交互系统与装置,包括无人机、以及由所述无人机构建的无人机节点、无人机节点知识库、无人机组网以及交互系统,每个所述无人机节点上分别设有一个所述交互系统,所述无人机节点知识库通过编码将自然语言信息其转化为IEML元语知识库,所述无人机组网采用的是分层分簇结构,簇内成员通过中心节点进行信息传递,簇间节点也是通过该中心节点向外传递信息,传递的信息是由所述IEML元语知识库信息做载体。在无人机高动态组网过程中组网信息以IEML表达方法进行信息的传递。此外将无人机本地自然语言知识库(数据集)转化为IEML知识库,通过部署在无人机上的交互系统模型进行编码训练,实现无人机自主交互。
-
公开(公告)号:CN113660304A
公开(公告)日:2021-11-16
申请号:CN202110767145.4
申请日:2021-07-07
Applicant: 北京邮电大学 , 西藏高驰科技信息产业集团有限责任公司
IPC: H04L29/08
Abstract: 本发明公开一种基于双向拍卖博弈的无人机群分布式学习资源管控方法,其特征在于将无人机群联邦学习过程分为两个部分,包括:初始化阶段和学习阶段。联邦学习平台聚集接收到的局部模型,生成一个全局联合学习模型,并基于双向拍卖理论进行迭代更新,引入控制器使无人机群迭代的相互作用并调整他们的出价,使市场快速收敛到社会福利最大化点。随着参与者的增加,总福利增加,收敛速度降低。这种现象是由于更多的FL平台的参与会带来更多的外部效用,同时更多的参与者也增加了系统的复杂性,从而延缓收敛速度。
-
公开(公告)号:CN113645589A
公开(公告)日:2021-11-12
申请号:CN202110774836.7
申请日:2021-07-09
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于反事实策略梯度的无人机集群路由计算方法,包括采用一种COMA动态自适应的强化学习算法,所述COMA算法采用了“集中式训练‑分布式执行”的混合架构。能够有效针对网络节点动态性高、网内流量波动性大的路由场景,COMA算法能够在网络平均生存时间与数据包传输成功率之间形成有效的权衡,进而实现高效而稳定的智能路由策略;能够更好地动态调正路由策略,实现对网络状态的全局最优响应。关于数据包将所选择的区域中的任意一个随机节点作为下一跳传输节点的设计,该设计不仅解决了多智能体环境下动作空间较大的问题,还提高了算法的稳定性,一定程度上减少了节点移动性对训练造成的干扰。
-
公开(公告)号:CN113315715A
公开(公告)日:2021-08-27
申请号:CN202110370309.X
申请日:2021-04-07
Applicant: 北京邮电大学
IPC: H04L12/801
Abstract: 本发明涉及一种基于QMIX的分布式网内拥塞控制方法,本发明通过直接将相关方法部署在网内的三层交换机中,进行数据包的调度与拥塞控制来克服上述传统技术的缺点,同时进一步提升了拥塞控制效果。本发明受到近年来,多智能体系统控制领域中的分布式强化学习方法的启发,采用多智能体强化学习方法中的集中式训练,分布式执行的算法框架,将QMIX算法直接在交换机内部实现,在快速响应毫秒级流量波动的同时,又做到了各交换机之间的协调控制,从而达到稳定的全局最优系统状态,进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。
-
公开(公告)号:CN117880205B
公开(公告)日:2024-11-01
申请号:CN202410090534.1
申请日:2024-01-23
Applicant: 北京邮电大学
IPC: H04L47/125 , H04L45/125 , H04L45/122 , H04L45/302 , H04L45/76 , H04L49/15
Abstract: 本发明公开了一种负载均衡的优化方法、相关服务器及系统。本发明提供的负载均衡的优化方法包括:在SDN网络中,循环迭代地执行下述步骤直至收敛:获取SDN的数据平面采集的所述网络内各链路的带宽利用率的数据,生成反映当前时刻各链路负载情况的网络状态信息;在所述SDN网络的控制平面,以所述网络状态信息作为输入,对生成式扩散模型进行训练,通过所述GDM模型输出所述网络中各链路的优先级权重;根据所述各链路的优先级权重,重新生成流表项并下发至所述网络中各交换机,以使得所述各交换机按照所述更新后的流表项定义的转发优先级转发数据。本发明利用生成式扩散模型实现对网络中各个链路的动态地、实时地进行负载均衡的优化。
-
-
-
-
-
-
-
-
-