一种基于深度Q学习的交通信号控制方法

    公开(公告)号:CN111653106A

    公开(公告)日:2020-09-11

    申请号:CN202010294012.5

    申请日:2020-04-15

    Inventor: 黄亚男 曾振平

    Abstract: 本发明公开了一种基于深度Q学习的交通信号控制方法,构建交通流与单交叉口环境;构建深度Q学习模型,使用卷积神经网络作为Q值的逼近函数,其中卷积神经网络包括若干卷积层和一个全连接层,网络的激活函数是relu函数,损失函数是均方误差函数,优化器是AdamOptimizer优化器,输入数据经过卷积层和全连接层后得到最后的输出;设置训练参数训练深度Q学习模型;采集实际交叉口的汽车位置和速度,确定交通信号控制动作。本发明通过学习动作与状态变化之间的样本数据来得出最优的策略,适于时变的交通流与复杂的环境,能够有效避免实际操作中维度爆炸问题的出现。

Patent Agency Ranking