-
公开(公告)号:CN119370109A
公开(公告)日:2025-01-28
申请号:CN202411389343.1
申请日:2024-09-30
Applicant: 清华大学
IPC: B60W50/00 , B60W60/00 , G06F18/2131 , G06N3/092
Abstract: 本公开涉及适用于端到端自动驾驶的动作平滑型强化学习策略网络。包括:获取传感器采集的观测数据;将观测数据输入策略网络中的傅里叶滤波层,可以过滤观测噪音、提取观测输入中的重要频率,并得到滤波后的特征;将当前时刻的滤波后的特征输入策略网络中的后续子网络,得到车辆控制动作,车辆控制动作用于控制车辆进行自动驾驶;子网络使用雅克比正则化方法控制策略函数的平滑程度。根据本申请实施例,可以有效地解决强化学习用于端到端自动驾驶的动作震荡问题,提高策略网络输出的动作平滑性。