基于深度强化学习的瓶颈区换道控制方法、设备及介质

    公开(公告)号:CN117079450B

    公开(公告)日:2024-12-10

    申请号:CN202310808834.4

    申请日:2023-07-03

    Abstract: 本发明公开了基于深度强化学习的瓶颈区换道控制方法、设备及介质,通过选取一定比例的车辆使其提前换道来避免临近瓶颈区车辆集中换道而导致通行能力下降的发生,通过奖励函数的设计实现了每条车道车辆密度的平均,以最大限度避免了集中换道和为了追求速度的频繁换道行为,保证了瓶颈区交通流的稳定。此外,通过DQN网络与环境的交互更新训练,得到最优换道策略,该最优换道策略可协调控制瓶颈区车辆的换道行为,通过在瓶颈区上游进行提前换道,避免临近瓶颈区车辆集中换道导致交通拥堵的发生,有效地解决瓶颈区通行能力下降的问题。本发明的瓶颈区换到控制方法与传统的基于交通流控制方案相比,减少了车辆的平均行程时间,提高了通行效率。

    基于深度强化学习的瓶颈区换道控制方法、设备及介质

    公开(公告)号:CN117079450A

    公开(公告)日:2023-11-17

    申请号:CN202310808834.4

    申请日:2023-07-03

    Abstract: 本发明公开了基于深度强化学习的瓶颈区换道控制方法、设备及介质,通过选取一定比例的车辆使其提前换道来避免临近瓶颈区车辆集中换道而导致通行能力下降的发生,通过奖励函数的设计实现了每条车道车辆密度的平均,以最大限度避免了集中换道和为了追求速度的频繁换道行为,保证了瓶颈区交通流的稳定。此外,通过DQN网络与环境的交互更新训练,得到最优换道策略,该最优换道策略可协调控制瓶颈区车辆的换道行为,通过在瓶颈区上游进行提前换道,避免临近瓶颈区车辆集中换道导致交通拥堵的发生,有效地解决瓶颈区通行能力下降的问题。本发明的瓶颈区换到控制方法与传统的基于交通流控制方案相比,减少了车辆的平均行程时间,提高了通行效率。

Patent Agency Ranking