-
公开(公告)号:CN117799637A
公开(公告)日:2024-04-02
申请号:CN202311710703.9
申请日:2023-12-13
Applicant: 电子科技大学长三角研究院(衢州)
IPC: B60W60/00 , B60W50/00 , G06N3/0455 , G06N3/0475 , G06N3/042 , G06N3/092 , G06N3/0499 , G06N3/0442 , G06N3/096
Abstract: 本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,本发明提出了一个支持增量学习的模仿学习模型,基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练,并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习,模型可以根据不断积累的数据不断改进性能,而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数,以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型,同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架,以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。
-
公开(公告)号:CN117104270B
公开(公告)日:2024-08-27
申请号:CN202311134645.X
申请日:2023-09-04
Applicant: 电子科技大学长三角研究院(衢州) , 电子科技大学(深圳)高等研究院
IPC: B60W60/00 , B60W30/18 , B60W50/00 , G06F18/214 , G06N3/092
Abstract: 本发明公开了一种基于规则辅助强化学习的自动驾驶决策方法,针对自动驾驶车辆在接近路口之前需要进入指定车道的目标车道进入任务进行了深入研究和应用。考虑到强化学习策略需要理解车辆进入目标车道的紧迫性以及与基于规则的策略的结合难点,融合了规则引导与强化学习策略,实现了两者的互补优势。为了更准确地指导自动驾驶车辆做出与目标导向的驾驶决策,本发明提出了一个包括安全性、效率、舒适性和紧急性在内的四项混合奖励函数。为了进一步优化基于强化学习的策略,本发明还设计了规则修订策略,不仅监控强化学习的驾驶决策策略,还能引导策略从实际的干预中获得学习并不断完善。本发明在多种宏观和微观评价指标上都展现了出色的性能。
-
公开(公告)号:CN114782493A
公开(公告)日:2022-07-22
申请号:CN202210426595.1
申请日:2022-04-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明公开了一种基于自编码器的不定长行人轨迹预测方法,包括:S1、采用自编码器提取不定长行人轨迹特征,并将不同的历史轨迹在编码阶段扩充到相同的维度;S2、计算目标行人对周围每一个行人编码后的向量的注意力得分,并将这些注意力得分经过权重矩阵合并求值,得到每个行人对于目标行人的注意力权值,并以此作为输出传递给LSTM进行最终的轨迹预测;S3、利用迁移学习方法对自编码器进行模型训练;S4、循环步骤S1~S3。本发明通过利用历史轨迹以及行人之间的相互作用使得目标行人的未来轨迹预测更加接近其真实的未来轨迹。
-
公开(公告)号:CN117799637B
公开(公告)日:2025-05-09
申请号:CN202311710703.9
申请日:2023-12-13
Applicant: 电子科技大学长三角研究院(衢州)
IPC: B60W60/00 , B60W50/00 , G06N3/0455 , G06N3/0475 , G06N3/042 , G06N3/092 , G06N3/0499 , G06N3/0442 , G06N3/096
Abstract: 本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,本发明提出了一个支持增量学习的模仿学习模型,基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练,并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习,模型可以根据不断积累的数据不断改进性能,而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数,以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型,同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架,以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。
-
公开(公告)号:CN117104270A
公开(公告)日:2023-11-24
申请号:CN202311134645.X
申请日:2023-09-04
Applicant: 电子科技大学长三角研究院(衢州) , 电子科技大学(深圳)高等研究院
IPC: B60W60/00 , B60W30/18 , B60W50/00 , G06F18/214 , G06N3/092
Abstract: 本发明公开了一种基于规则辅助强化学习的自动驾驶决策方法,针对自动驾驶车辆在接近路口之前需要进入指定车道的目标车道进入任务进行了深入研究和应用。考虑到强化学习策略需要理解车辆进入目标车道的紧迫性以及与基于规则的策略的结合难点,融合了规则引导与强化学习策略,实现了两者的互补优势。为了更准确地指导自动驾驶车辆做出与目标导向的驾驶决策,本发明提出了一个包括安全性、效率、舒适性和紧急性在内的四项混合奖励函数。为了进一步优化基于强化学习的策略,本发明还设计了规则修订策略,不仅监控强化学习的驾驶决策策略,还能引导策略从实际的干预中获得学习并不断完善。本发明在多种宏观和微观评价指标上都展现了出色的性能。
-
-
-
-