基于在线强化学习的列车车队数据路由系统及方法

    公开(公告)号:CN114338497A

    公开(公告)日:2022-04-12

    申请号:CN202111598690.1

    申请日:2021-12-24

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于在线强化学习的列车车队数据路由系统及方法,其中系统包括设置于列车车队中各列车成员内的列车通信装置和路由决策模块,以及设置于列车车队中头车内的训练模块;列车通信装置用于构建车队和进行组网;路由决策模块包括状态数据收集模块和神经网络路由决策模块,状态数据收集模块用于采集对应列车的通信状态信息和行驶状态信息;神经网络路由决策模块用于根据采集的数据进行路由决策,并将决策经验发送到头车;训练模块用于利用获取的决策经验对路由策略选择神经网络进行训练,并将训练完成后的路由策略选择神经网络参数反馈到各列车成员进行参数更新。本发明实现能够根据环境自适应调整的在线强化学习路由决策。

Patent Agency Ranking