-
公开(公告)号:CN116155819A
公开(公告)日:2023-05-23
申请号:CN202310424468.2
申请日:2023-04-20
Applicant: 北京邮电大学
IPC: H04L47/125 , G06N3/092
Abstract: 本发明提供了一种基于可编程数据平面的智能网内负载均衡方法与装置,涉及通信的技术领域,该方法应用于控制平面,通过获取网络系统中每个交换机的队列深度来实现全局拥塞感知,并利用强化学习算法确定目标交换机的端口转发概率,以辅助决策目标交换机的数据包转发路径。由于强化学习算法的奖励函数值与网络系统中交换机的队列深度差值和平均队列深度成反比,所以能够达到网络中负载均衡效果越差则奖励越少的目的,进而使得智能体输出的动作向减小拥塞、增强负载均衡效果的方向发展。在不对称的网络拓扑环境中仍具备较佳的负载均衡效果,有效地缓解了现有的负载均衡方法负载均衡效果差和普适性差的技术问题。
-
公开(公告)号:CN114884958A
公开(公告)日:2022-08-09
申请号:CN202210811936.7
申请日:2022-07-12
Applicant: 北京邮电大学
IPC: H04L67/10 , H04L67/1008 , H04L67/101 , H04B7/185 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种星地融合网络中的计算任务卸载方法、装置和电子设备,涉及通信的技术领域,包括:获取星地融合网络中目标边缘网络内所有地面装置的任务状态参数;利用目标神经网络模型对所有地面装置的任务状态参数进行处理,得到每个地面装置的配置参数;其中,目标神经网络模型是基于目标边缘网络的计算任务传输开销计算模型训练的,且计算任务传输开销计算模型的目标为计算任务的传输开销最小;基于所有地面装置的配置参数确定目标边缘网络的计算任务卸载策略;基于计算任务卸载策略,对目标边缘网络中的所有待执行计算任务进行卸载。该方法能够有效的对抗时变信道增益和随机任务到达,在满足用户服务质量的前提下最小化计算任务的传输开销。
-
公开(公告)号:CN114785738A
公开(公告)日:2022-07-22
申请号:CN202210677447.7
申请日:2022-06-16
Applicant: 北京邮电大学
IPC: H04L47/125 , H04L47/56 , H04L47/6275 , H04L45/12 , H04L45/00
Abstract: 本发明提供了一种时间敏感流的调度方法、装置和电子设备,涉及通信的技术领域,包括:获取待调度的时间敏感流集合和目标网络的网络拓扑信息;基于时间敏感流集合和网络拓扑信息,确定目标时间敏感流集合和目标时间敏感流集合对应的目标时隙队列映射关系;基于目标时隙队列映射关系对目标时间敏感流集合中的目标时间敏感流进行调度。本发明方法在从待调度的时间敏感流集合中确定目标时间敏感流时,将时间敏感流的路由代价和交换机端口队列的可用资源情况共同作为可调度条件进行综合考量,从而使得目标网络在调度时间敏感流时能够最大化的利用其网络资源,进而有效地缓解了现有的时间敏感流的调度方法存在的网络负载不均衡的技术问题。
-
公开(公告)号:CN113645589B
公开(公告)日:2024-05-17
申请号:CN202110774836.7
申请日:2021-07-09
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于反事实策略梯度的无人机集群路由计算方法,包括采用一种COMA动态自适应的强化学习算法,所述COMA算法采用了“集中式训练‑分布式执行”的混合架构。能够有效针对网络节点动态性高、网内流量波动性大的路由场景,COMA算法能够在网络平均生存时间与数据包传输成功率之间形成有效的权衡,进而实现高效而稳定的智能路由策略;能够更好地动态调正路由策略,实现对网络状态的全局最优响应。关于数据包将所选择的区域中的任意一个随机节点作为下一跳传输节点的设计,该设计不仅解决了多智能体环境下动作空间较大的问题,还提高了算法的稳定性,一定程度上减少了节点移动性对训练造成的干扰。
-
公开(公告)号:CN117580106B
公开(公告)日:2024-04-05
申请号:CN202410057576.5
申请日:2024-01-16
Applicant: 北京邮电大学
Abstract: 本发明提供了一种多策略池的星地网络快速调度与资源分配方法和装置,涉及通信的技术领域,包括:获取星地融合网络中目标用户终端的策略池;基于所有用户终端的当前任务调度策略,确定星地融合网络中所有卫星当前的资源分配策略和目标用户终端当前的效用函数值;计算目标用户终端选择策略池中的指定任务调度策略时,更新后的资源分配策略和效用函数值;若更新后的效用函数值大于当前的效用函数值,则调整为指定任务调度策略;否则,维持当前任务调度策略;在确定所有用户终端完成预设轮次的策略间效用函数值比较之后,得到目标任务调度策略和目标资源分配策略。为星地融合网络中用户‑卫星‑云平台架构下的任务调度与资源分配提供了解决方案。
-
公开(公告)号:CN117580106A
公开(公告)日:2024-02-20
申请号:CN202410057576.5
申请日:2024-01-16
Applicant: 北京邮电大学
Abstract: 本发明提供了一种多策略池的星地网络快速调度与资源分配方法和装置,涉及通信的技术领域,包括:获取星地融合网络中目标用户终端的策略池;基于所有用户终端的当前任务调度策略,确定星地融合网络中所有卫星当前的资源分配策略和目标用户终端当前的效用函数值;计算目标用户终端选择策略池中的指定任务调度策略时,更新后的资源分配策略和效用函数值;若更新后的效用函数值大于当前的效用函数值,则调整为指定任务调度策略;否则,维持当前任务调度策略;在确定所有用户终端完成预设轮次的策略间效用函数值比较之后,得到目标任务调度策略和目标资源分配策略。为星地融合网络中用户‑卫星‑云平台架构下的任务调度与资源分配提供了解决方案。
-
公开(公告)号:CN113315715B
公开(公告)日:2024-01-05
申请号:CN202110370309.X
申请日:2021-04-07
Applicant: 北京邮电大学
IPC: H04L47/12
Abstract: 本发明涉及一种基于QMIX的分布式网内拥塞控制方法,本发明通过直接将相关方法部署在网内的三层交换机中,进行数据包的调度与拥塞控制来克服上述传统技术的缺点,同时进一步提升了拥塞控制效果。本发明受到近年来,多智能体系统控制领域中的分布式强化学习方法的启发,采用多智能体强化学习方法中的集中式训练,分布式执行的算法框架,将QMIX算法直接在交换机内部实现,在快速响应毫秒级流量波动的同时,又做到了各交换机之间的协调控制,从而达到稳定的全局最优系统状态,进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。(56)对比文件高少华.基于深度强化学习的TCP拥塞控制机制研究.信息科技.2021,(第4期),全文.王亚东;张悦;陈延祥;张宇.命名数据网络中的一种主动拥塞控制机制研究.载人航天.2020,(第01期),全文.肖扬;吴家威;李鉴学;刘军.一种基于深度强化学习的动态路由算法.信息通信技术与政策.2020,(第09期),全文.
-
公开(公告)号:CN116155819B
公开(公告)日:2023-07-14
申请号:CN202310424468.2
申请日:2023-04-20
Applicant: 北京邮电大学
IPC: H04L47/125 , G06N3/092
Abstract: 本发明提供了一种基于可编程数据平面的智能网内负载均衡方法与装置,涉及通信的技术领域,该方法应用于控制平面,通过获取网络系统中每个交换机的队列深度来实现全局拥塞感知,并利用强化学习算法确定目标交换机的端口转发概率,以辅助决策目标交换机的数据包转发路径。由于强化学习算法的奖励函数值与网络系统中交换机的队列深度差值和平均队列深度成反比,所以能够达到网络中负载均衡效果越差则奖励越少的目的,进而使得智能体输出的动作向减小拥塞、增强负载均衡效果的方向发展。在不对称的网络拓扑环境中仍具备较佳的负载均衡效果,有效地缓解了现有的负载均衡方法负载均衡效果差和普适性差的技术问题。
-
公开(公告)号:CN114189481A
公开(公告)日:2022-03-15
申请号:CN202111409558.1
申请日:2021-11-25
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于深度强化学习的TSN流调度方法,其特征在于,包括消除在TSN交换机处的排队时延来用以完成时延敏感流的无等待传输,其中以对单播时间敏感流进行无等待调度的情况进行处理,TSN能够提供确定性时延、带宽保证等能力,同时降低了成本。时间敏感网络通过全网时钟同步、流量调度以及系统配置三种主要机制来实现确定性低时延保障。同时减少保护带的数量,并且将时间敏感流的传输都压缩在调度表的开始,因此有更多的带宽资源可以用于尽力而为流的传输。
-
公开(公告)号:CN115473561B
公开(公告)日:2023-06-30
申请号:CN202110654258.3
申请日:2021-06-11
Applicant: 北京邮电大学 , 中国电子信息产业集团有限公司第六研究所
Abstract: 本发明公开一种基于协作Q学习的分布式卫星网络智能负载均衡方法,包括:所述方法将CollaQ强化学习算法应用于卫星通信,其数据传输过程为:1).地面将数据包发送到卫星,接收卫星将数据包缓存在队列中;2).卫星根据所提出的算法将数据包发送到相邻卫星;3).目的卫星将信息发送回地面上的目的地。每个轨道上分布的卫星数相等,将轨道数定义为m,每个轨道中的卫星数为n。相邻轨道之间的经度差为360°/m,同一轨道中相邻卫星之间的经度差为180°/n。在本发明中CollaQ算法在处理环境中复杂的Agent拓扑时具有良好的收敛性,并且可以很好地应对系统规模的变化。CollaQ的性能要优于DDPG,并且网络中的最大链路利用率相对较小,这意味着它可以更有效地实现负载平衡。
-
-
-
-
-
-
-
-
-