-
公开(公告)号:CN114372501A
公开(公告)日:2022-04-19
申请号:CN202111437745.0
申请日:2021-11-29
Applicant: 清华大学
Abstract: 本发明涉及自动驾驶技术领域,尤其涉及一种自动驾驶训练方法、装置、设备、存储介质及程序产品。方法包括:获取自动驾驶训练所需要的训练样本集,其中,训练样本集包括至少一个专家样本和至少一个非专家样本;通过预设的评分器,确定各非专家样本中的类专家样本,并提高驾驶模仿策略中类专家样本的训练权重,其中,评分器用于对训练样本集中的每一个训练样本进行评分,类专家样本的训练结果与专家样本的训练结果在预设误差内;通过训练样本,按照调整权重后的驾驶模仿策略,对自动驾驶车辆进行模仿训练。本发明用以解决现有技术中对自动驾驶车辆进行训练时,安全性差、效率低的问题,实现安全地对自动驾驶车辆进行高效率训练。
-
公开(公告)号:CN114372501B
公开(公告)日:2024-11-29
申请号:CN202111437745.0
申请日:2021-11-29
Applicant: 清华大学
IPC: G06F18/214 , G09B9/04 , G06F18/24
Abstract: 本发明涉及自动驾驶技术领域,尤其涉及一种自动驾驶训练方法、装置、设备、存储介质及程序产品。方法包括:获取自动驾驶训练所需要的训练样本集,其中,训练样本集包括至少一个专家样本和至少一个非专家样本;通过预设的评分器,确定各非专家样本中的类专家样本,并提高驾驶模仿策略中类专家样本的训练权重,其中,评分器用于对训练样本集中的每一个训练样本进行评分,类专家样本的训练结果与专家样本的训练结果在预设误差内;通过训练样本,按照调整权重后的驾驶模仿策略,对自动驾驶车辆进行模仿训练。本发明用以解决现有技术中对自动驾驶车辆进行训练时,安全性差、效率低的问题,实现安全地对自动驾驶车辆进行高效率训练。
-