-
公开(公告)号:CN114760644A
公开(公告)日:2022-07-15
申请号:CN202210261960.8
申请日:2022-03-17
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度强化学习的多链路传输智能报文调度方法,将MPTCP发送方的数据包传输过程划分为若干个数据包调度周期,在每个调度周期将网络环境状态输入深度确定性策略梯度模型,得到一组表示数据包调度策略的调度动作。根据设定的奖励函数,计算调度动作的奖励值,更新模型神经网络参数,优化多链路传输报文调度策略,使模型可以学习在各种网络环境下的最优调度策略相比传统的启发式调度算法,本发明方法可以适应各种复杂多样的动态网络环境,使用基于Actor‑Critic强化学习框架的深度确定性策略梯度模型,直接对MPTCP数据包调度策略进行建模和学习,将MPTCP数据包调度策略输出和策略评估分开,从而优化调度粒度,提高数据包调度性能。