-
公开(公告)号:CN117799637A
公开(公告)日:2024-04-02
申请号:CN202311710703.9
申请日:2023-12-13
Applicant: 电子科技大学长三角研究院(衢州)
IPC: B60W60/00 , B60W50/00 , G06N3/0455 , G06N3/0475 , G06N3/042 , G06N3/092 , G06N3/0499 , G06N3/0442 , G06N3/096
Abstract: 本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,本发明提出了一个支持增量学习的模仿学习模型,基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练,并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习,模型可以根据不断积累的数据不断改进性能,而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数,以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型,同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架,以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。
-
公开(公告)号:CN117799637B
公开(公告)日:2025-05-09
申请号:CN202311710703.9
申请日:2023-12-13
Applicant: 电子科技大学长三角研究院(衢州)
IPC: B60W60/00 , B60W50/00 , G06N3/0455 , G06N3/0475 , G06N3/042 , G06N3/092 , G06N3/0499 , G06N3/0442 , G06N3/096
Abstract: 本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,本发明提出了一个支持增量学习的模仿学习模型,基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练,并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习,模型可以根据不断积累的数据不断改进性能,而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数,以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型,同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架,以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。
-