-
公开(公告)号:CN110581808A
公开(公告)日:2019-12-17
申请号:CN201910778639.5
申请日:2019-08-22
Applicant: 武汉大学
IPC: H04L12/801 , H04L12/807 , H04L12/815 , H04L12/823 , H04L12/841 , H04L12/24
Abstract: 本发明公开了一种基于深度强化学习的拥塞控制方法及系统,其中的拥塞控制方法,首先初始化网络的环境和模型参数,然后利用收集到的网络中的当前窗口、吞吐量、时延以及数据发送率等来对拥塞控制模型进行训练,根据训练结果选出模型损失函数值最小和奖励函数值最大的拥塞控制模型,然后将模型部署到网络中,进行拥塞控制。本发明的方法依据当前的网络吞吐量、往返时延以及数据丢包率动态的调整拥塞窗口的大小,从而控制数据的发送率,并提高网络的吞吐量,降低数据传输延迟和丢包率,从而降低网络拥塞的发生,达到优化网络性能的目的。
-
公开(公告)号:CN110581808B
公开(公告)日:2021-06-15
申请号:CN201910778639.5
申请日:2019-08-22
Applicant: 武汉大学
IPC: H04L12/801 , H04L12/807 , H04L12/815 , H04L12/823 , H04L12/841 , H04L12/24
Abstract: 本发明公开了一种基于深度强化学习的拥塞控制方法及系统,其中的拥塞控制方法,首先初始化网络的环境和模型参数,然后利用收集到的网络中的当前窗口、吞吐量、时延以及数据发送率等来对拥塞控制模型进行训练,根据训练结果选出模型损失函数值最小和奖励函数值最大的拥塞控制模型,然后将模型部署到网络中,进行拥塞控制。本发明的方法依据当前的网络吞吐量、往返时延以及数据丢包率动态的调整拥塞窗口的大小,从而控制数据的发送率,并提高网络的吞吐量,降低数据传输延迟和丢包率,从而降低网络拥塞的发生,达到优化网络性能的目的。
-