Patent search ap:("中国科学院计算技术研究所") AND inv:"牛京玉" Page 1

1.

发明授权
一种构建自动驾驶决策系统的方法、系统和介质有权

公开(公告)号：CN111985614B

公开(公告)日：2023-03-24

申请号：CN202010715409.7

申请日：2020-07-23

Applicant: 中国科学院计算技术研究所

Inventor： 牛京玉 , 胡瑜 , 韩银和 , 李晓维

IPC: G06N3/092 , G06N3/0464 , B60W60/00

Abstract: 本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质，所述自动驾驶决策系统包括强化学习模块和安全保障模块，所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块，所述方法包括：A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数；A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练；本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策，节约了大量的训练成本，而且本发明的系统输出解析解作为经纠正的安全的动作向量，为驾驶的安全性提供了理论支撑，可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。

2.

发明公开
一种构建自动驾驶决策系统的方法、系统和介质有权

公开(公告)号：CN111985614A

公开(公告)日：2020-11-24

申请号：CN202010715409.7

申请日：2020-07-23

Applicant: 中国科学院计算技术研究所

Inventor： 牛京玉 , 胡瑜 , 韩银和 , 李晓维

IPC: G06N3/04 , G06N3/08 , G06N20/00 , B60W60/00

Abstract: 本发明实施例提供了一种构建自动驾驶决策系统的方法、系统和介质，所述自动驾驶决策系统包括强化学习模块和安全保障模块，所述安全保障模块包括基于规则的子模块和基于数据驱动的子模块，所述方法包括：A1、随机初始化强化学习模块和基于数据驱动的子模块的神经网络参数；A2、对自动驾驶决策系统依次进行第一学习阶段和第二学习阶段的训练；本发明无需大量的专家经验指导自动驾驶决策系统如何进行决策，节约了大量的训练成本，而且本发明的系统输出解析解作为经纠正的安全的动作向量，为驾驶的安全性提供了理论支撑，可以提高在实际应用中根据自动驾驶决策系统决策生成的动作向量进行自动驾驶的安全性。

Patent Agency Ranking