-
公开(公告)号:CN115766583B
公开(公告)日:2025-03-18
申请号:CN202211422331.5
申请日:2022-11-14
Applicant: 北京邮电大学
IPC: H04L47/12 , H04L47/193 , H04L47/20 , H04L47/2466
Abstract: 本申请提供一种基于强化学习的多路径TCP拥塞控制方法和装置,方法包括:若检测到目标网络当前的网络环境发送变化,则获取目标网络在当前时刻的目标网络状态数据;将目标网络状态数据加入包含有先验数据的数据集中,并基于更新后的数据集以深度强化学习算法对预设的智能体进行微调,得到适用于目标网络当前的网络环境的新智能体,以基于该新智能体对目标网络进行拥塞控制;智能体预先以深度强化学习算法基于包含有先验数据的数据集离线预训练得到。本申请能够在网络环境变化时及时且自动对智能体进行在线微调,并能够提高智能体更新的效率及有效性,保证智能体持续的高性能,以提高使用智能体进行多路径TCP拥塞控制的有效性及可靠性。
-
公开(公告)号:CN115037672B
公开(公告)日:2023-07-18
申请号:CN202210462002.7
申请日:2022-04-28
Applicant: 北京邮电大学
IPC: H04L45/24 , H04L47/193
Abstract: 本申请提供一种多路径拥塞控制方法及装置,方法包括:实时监测基于多路径传输控制协议MPTCP的目标网络当前是否处于非阻塞状态;若目标网络当前处于非阻塞状态,则使用一个单子流强化学习模型应用于MPTCP的各个子流,对目标网络的数据传输进行符合公平性原则的拥塞控制。本申请能够实现强化学习模型DRL在基于多路径传输控制协议MPTCP的网络拥塞控制中的应用,能够有效提高多路径拥塞控制的及时性及可靠性;并能够有效避免阻塞对目标网络中数据传输性能带来的影响,提高拥塞控制的智能化程度,进而能够有效保证基于多路径传输控制协议的目标网络的运行稳定性,更适用于高速网络。
-
公开(公告)号:CN117177294A
公开(公告)日:2023-12-05
申请号:CN202311089743.6
申请日:2023-08-25
Applicant: 北京邮电大学
Abstract: 本发明提供一种低轨道卫星网络拥塞控制方法和装置,所述方法包括:在离线状态下,获取网络数据训练集对目标智能体进行强化学习。该训练集包含不同时刻的状态、动作、下一时刻状态和奖励值的时序数据。强化学习过程中,基于奖励值、目标动作值函数和估计动作值函数,引入期望分位数回归函数构建TD损失函数。利用状态值函数、目标动作值函数、估计动作值函数构建第一损失函数和第二损失函数。最后提取策略函数。对所有函数的参数进行迭代更新。在线状态下,基于实时网络获取的时序数据更新网络数据训练集。利用更新后的训练集,执行强化学习优化参数。本发明能够适应高度动态变化的LEO卫星网络,提供安全有效的策略,快速适应新环境,保持高性能。
-
公开(公告)号:CN115037672A
公开(公告)日:2022-09-09
申请号:CN202210462002.7
申请日:2022-04-28
Applicant: 北京邮电大学
IPC: H04L45/24 , H04L47/193
Abstract: 本申请提供一种多路径拥塞控制方法及装置,方法包括:实时监测基于多路径传输控制协议MPTCP的目标网络当前是否处于非阻塞状态;若目标网络当前处于非阻塞状态,则使用一个单子流强化学习模型应用于MPTCP的各个子流,对目标网络的数据传输进行符合公平性原则的拥塞控制。本申请能够实现强化学习模型DRL在基于多路径传输控制协议MPTCP的网络拥塞控制中的应用,能够有效提高多路径拥塞控制的及时性及可靠性;并能够有效避免阻塞对目标网络中数据传输性能带来的影响,提高拥塞控制的智能化程度,进而能够有效保证基于多路径传输控制协议的目标网络的运行稳定性,更适用于高速网络。
-
公开(公告)号:CN116709460A
公开(公告)日:2023-09-05
申请号:CN202310686563.X
申请日:2023-06-09
Applicant: 北京邮电大学
IPC: H04W40/02 , H04L47/125 , H04L45/12 , H04L45/247 , H04L45/00 , H04B7/185
Abstract: 本发明提供卫星网络的路由优化、转发方法、电子设备和存储介质,本优化方法根据当前遥测周期内卫星网络中各卫星节点的遥测信息,在各卫星节点中查找当前带转发的数据包指定的源节点到目的节点的所有可达路径,并根据所有可达路径确定当前遥测周期的备选路径;在当前遥测周期的备选路径中选择最优可达路径;根据用于路由优化的效用函数,利用所述最优可达路径对原始路径集中的原始路径进行优化,形成当前遥测周期的优化路径集;所述原始路径集为上一个遥测周期的优化路径集。本发明根据当前遥测周期的网络状态实时调整路由,能够均衡网络流量负载,实现卫星网络的路由优化。
-
公开(公告)号:CN115766583A
公开(公告)日:2023-03-07
申请号:CN202211422331.5
申请日:2022-11-14
Applicant: 北京邮电大学
IPC: H04L47/12 , H04L47/193 , H04L47/20 , H04L47/2466
Abstract: 本申请提供一种基于强化学习的多路径TCP拥塞控制方法和装置,方法包括:若检测到目标网络当前的网络环境发送变化,则获取目标网络在当前时刻的目标网络状态数据;将目标网络状态数据加入包含有先验数据的数据集中,并基于更新后的数据集以深度强化学习算法对预设的智能体进行微调,得到适用于目标网络当前的网络环境的新智能体,以基于该新智能体对目标网络进行拥塞控制;智能体预先以深度强化学习算法基于包含有先验数据的数据集离线预训练得到。本申请能够在网络环境变化时及时且自动对智能体进行在线微调,并能够提高智能体更新的效率及有效性,保证智能体持续的高性能,以提高使用智能体进行多路径TCP拥塞控制的有效性及可靠性。
-
-
-
-
-