基于分层强化学习的即时配送实时合作调度系统

    公开(公告)号:CN115510664A

    公开(公告)日:2022-12-23

    申请号:CN202211225237.0

    申请日:2022-10-09

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于分层强化学习的即时配送实时合作调度系统,包括模拟器模块、决策模块和时间约束模块,模拟器模块用于模拟配送员在即时配送中的常规流程以及为算法构建训练和评估的环境,进行分配订单和调度配送员;决策模块:基于分层强化学习的合作配送调度模型,通过Actor‑Critic网络提取特征,作出基于相遇交互的配送员合作配送决策,将该决策反馈至模拟器循环;时间约束模块综合考虑订单的实时剩余配送时间、订单的历史订单转移次数、即时配送的实时调度要求,对决策模块中的决策方案进行调度和指导。本系统通过调度推荐配送员相遇交互进行合作配送,以提高配送过程顺路单量、在满足配送时间约束的条件下提升配送效率、降低订单超时率的总体目标。

Patent Agency Ranking