-
公开(公告)号:CN116822898A
公开(公告)日:2023-09-29
申请号:CN202310860203.7
申请日:2023-07-13
Applicant: 长安大学
IPC: G06Q10/0631 , G06Q50/06 , G06N7/01 , G06N3/092
Abstract: 本发明提供一种基于深度强化学习的电动汽车车队调度方法和系统,包括:在电动汽车车队调度的约束条件下,确定调度的优化目标为最小化时间成本和最大化电动汽车接单数;基于电动汽车车队调度的优化目标,构建有限离散时隙的马尔可夫决策过程;通过深度Q网络求解得到有限离散时隙的马尔可夫决策过程中的最优动作价值函数,根据最优动作价值函数对应的最优动作,得到充电决策;所述最优动作为充电或不充电;针对有限离散时隙的马尔可夫决策过程,构建订单的派遣问题,对派遣问题进行求解,得到订单分配决策。本发明通过深度强化学习动态地协调每个时间步的电动汽车车队的充电与接单,为电动汽车选择合适的时机进行充电。