-
公开(公告)号:CN118280128A
公开(公告)日:2024-07-02
申请号:CN202410249099.2
申请日:2024-03-05
Applicant: 北京易华录信息技术股份有限公司
Abstract: 本发明提供一种基于人类反馈的强化学习交通信号控制优化方法,采用的强化学习流程中,将路网模拟器作为环境,信号控制网络作为智能体,信号控制网络在与路网模拟器的多轮交互中不断优化自己的信号控制策略。所述基于人类反馈的强化学习交通信号控制优化方法,根据区域中所有交叉路口的流量情况进行协调配时,能够解决信号灯控制的自适应问题;同时基于人类反馈的强化学习能够将业务专家的经验很好地结合到算法模型中,可以使信控策略更符合人类的偏好,更贴合实际应用的场景。本发明提供的基于人类反馈的强化学习交通信号控制优化方法,能够缩短整个路网中的车辆等待时间,提高路网整体的通行效率。