-
公开(公告)号:CN111985614B
公开(公告)日:2023-03-24
申请号:CN202010715409.7
申请日:2020-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06N3/092 , G06N3/0464 , B60W60/00
Abstract: 本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质,所述自动驾驶决策系统包括强化学习模块和安全保障模块,所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块,所述方法包括:A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数;A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练;本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策,节约了大量的训练成本,而且本发明的系统输出解析解作为经纠正的安全的动作向量,为驾驶的安全性提供了理论支撑,可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。
-
公开(公告)号:CN111985614A
公开(公告)日:2020-11-24
申请号:CN202010715409.7
申请日:2020-07-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质,所述自动驾驶决策系统包括强化学习模块和安全保障模块,所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块,所述方法包括:A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数;A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练;本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策,节约了大量的训练成本,而且本发明的系统输出解析解作为经纠正的安全的动作向量,为驾驶的安全性提供了理论支撑,可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。
-