-
公开(公告)号:CN117116064A
公开(公告)日:2023-11-24
申请号:CN202310811117.7
申请日:2023-07-04
Applicant: 华北水利水电大学
IPC: G08G1/07 , G06N3/0464 , G06N3/08 , G08G1/08
Abstract: 本发明提出了一种基于深度强化学习的乘客延误最小化信号控制方法,步骤为:确定各信号相位及其非冲突相位,计算饱和流量;收集所有联网车的实时车辆数据;计算初始阶段各相位车辆在持续绿灯条件下通过停车线所需时间;基于乘客延误的指标定义深度强化学习的状态、动作和奖励,将车辆状态和信号状态通过矩阵合并和压缩;采用预训练与双重DQN结合的深度强化学习训练方法,估算状态和动作对应的价值函数,并采用主网络选取动作策略、目标网络评估价值函数、定期更新的双重DQN方法避免陷入局部最优,找到能获得最大乘客收益的相位方案。本发明结合实时收集的实时车辆数据自适应地进行灵活的信号相位优化,使交叉口的平均乘客延误达到最低。