一种基于规则辅助强化学习的自动驾驶决策方法

    公开(公告)号:CN117104270B

    公开(公告)日:2024-08-27

    申请号:CN202311134645.X

    申请日:2023-09-04

    Inventor: 郑凯 苏涵 曾曦霂

    Abstract: 本发明公开了一种基于规则辅助强化学习的自动驾驶决策方法,针对自动驾驶车辆在接近路口之前需要进入指定车道的目标车道进入任务进行了深入研究和应用。考虑到强化学习策略需要理解车辆进入目标车道的紧迫性以及与基于规则的策略的结合难点,融合了规则引导与强化学习策略,实现了两者的互补优势。为了更准确地指导自动驾驶车辆做出与目标导向的驾驶决策,本发明提出了一个包括安全性、效率、舒适性和紧急性在内的四项混合奖励函数。为了进一步优化基于强化学习的策略,本发明还设计了规则修订策略,不仅监控强化学习的驾驶决策策略,还能引导策略从实际的干预中获得学习并不断完善。本发明在多种宏观和微观评价指标上都展现了出色的性能。

    基于自编码器的不定长行人轨迹预测方法

    公开(公告)号:CN114782493A

    公开(公告)日:2022-07-22

    申请号:CN202210426595.1

    申请日:2022-04-21

    Abstract: 本发明公开了一种基于自编码器的不定长行人轨迹预测方法,包括:S1、采用自编码器提取不定长行人轨迹特征,并将不同的历史轨迹在编码阶段扩充到相同的维度;S2、计算目标行人对周围每一个行人编码后的向量的注意力得分,并将这些注意力得分经过权重矩阵合并求值,得到每个行人对于目标行人的注意力权值,并以此作为输出传递给LSTM进行最终的轨迹预测;S3、利用迁移学习方法对自编码器进行模型训练;S4、循环步骤S1~S3。本发明通过利用历史轨迹以及行人之间的相互作用使得目标行人的未来轨迹预测更加接近其真实的未来轨迹。

    一种基于规则辅助强化学习的自动驾驶决策方法

    公开(公告)号:CN117104270A

    公开(公告)日:2023-11-24

    申请号:CN202311134645.X

    申请日:2023-09-04

    Inventor: 郑凯 苏涵 曾曦霂

    Abstract: 本发明公开了一种基于规则辅助强化学习的自动驾驶决策方法,针对自动驾驶车辆在接近路口之前需要进入指定车道的目标车道进入任务进行了深入研究和应用。考虑到强化学习策略需要理解车辆进入目标车道的紧迫性以及与基于规则的策略的结合难点,融合了规则引导与强化学习策略,实现了两者的互补优势。为了更准确地指导自动驾驶车辆做出与目标导向的驾驶决策,本发明提出了一个包括安全性、效率、舒适性和紧急性在内的四项混合奖励函数。为了进一步优化基于强化学习的策略,本发明还设计了规则修订策略,不仅监控强化学习的驾驶决策策略,还能引导策略从实际的干预中获得学习并不断完善。本发明在多种宏观和微观评价指标上都展现了出色的性能。

Patent Agency Ranking