Patent search ap:("清华大学") AND inv:"王颢宁" Page 1

1.

发明公开
适用于端到端自动驾驶的动作平滑型强化学习策略网络审中-实审

公开(公告)号：CN119370109A

公开(公告)日：2025-01-28

申请号：CN202411389343.1

申请日：2024-09-30

Applicant: 清华大学

Inventor： 李升波 , 宋绪杰 , 刘童 , 段京良 , 郑一楠 , 王颢宁 , 林子钰 , 詹仙园 , 刘菁菁 , 张立平

IPC: B60W50/00 , B60W60/00 , G06F18/2131 , G06N3/092

Abstract: 本公开涉及适用于端到端自动驾驶的动作平滑型强化学习策略网络。包括：获取传感器采集的观测数据；将观测数据输入策略网络中的傅里叶滤波层，可以过滤观测噪音、提取观测输入中的重要频率，并得到滤波后的特征；将当前时刻的滤波后的特征输入策略网络中的后续子网络，得到车辆控制动作，车辆控制动作用于控制车辆进行自动驾驶；子网络使用雅克比正则化方法控制策略函数的平滑程度。根据本申请实施例，可以有效地解决强化学习用于端到端自动驾驶的动作震荡问题，提高策略网络输出的动作平滑性。

Patent Agency Ranking