-
公开(公告)号:CN116405904A
公开(公告)日:2023-07-07
申请号:CN202310358415.5
申请日:2023-04-06
Applicant: 上海大学
Abstract: 本发明涉及一种基于深度强化学习的TACS网络资源分配方法,包括如下步骤:针对列车自主运行系统构建隧道环境下的通信场景,并为所述通信场景内的通信业务划分信令优先级;在对所述通信场景中列车与列车间通信链路的最大时延进行约束的前提下,以列车自主运行系统吞吐量最大化为目标,构建多智能体深度强化学习模型;使用基于深度学习拟合、注意力机制和优先经验回放的深度确定性策略梯度算法对所述多智能体深度强化学习模型进行训练;基于训练好的多智能体深度强化学习模型,获取最佳动作策略,基于所述最佳动作策略实现网络资源的分配。与现有技术相比,本发明有效提高了TACS系统的总容量以及降低了T2T链路的传输时延。