-
公开(公告)号:CN119568156A
公开(公告)日:2025-03-07
申请号:CN202411790405.X
申请日:2024-12-06
Applicant: 东南大学
Abstract: 本发明涉及一种个性化的自动变道和速度控制驾驶协同决策方法,包括:步骤S1:构建个性化决策分层框架;步骤S2:搭建换道决策训练网络,确定换道决策的优化目标,同时引入动作屏蔽机制消除危险动作的安全隐患,设定训练所需的上层状态空间、动作空间和换道奖励函数,并赋予换道奖励函数个性化权重;步骤S3:搭建跟驰决策训练网络,确定跟驰决策的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的下层状态空间、动作空间和跟驰奖励函数,并赋予跟驰奖励函数个性化权重;步骤S4:采用协同决策方法并进行换道决策训练网络和跟驰决策训练网络的耦合训练,并搭建风格奖励优先体验回放来丰富经验回放优先级度量。与现有技术相比,本发明具有提高车辆的安全性和行驶效率等优点。
-
公开(公告)号:CN116257937A
公开(公告)日:2023-06-13
申请号:CN202310020281.6
申请日:2023-01-05
Applicant: 东南大学
IPC: G06F30/15 , B60W50/00 , G06F30/27 , G06F111/06 , G06F119/04 , G06F119/06
Abstract: 本发明公开了一种基于多目标深度强化学习的混合动力汽车生态驾驶方法,属于深度强化学习技术领域。包括如下步骤:构建混合动力汽车自适应巡航系统(ACC)与动力系统的模型;利用MODRL算法,建立基于MODRL的混合动力汽车跟驰场景下的能耗优化方法;进一步利用条件网络(CN),建立每个优化目标对应权重的输入网络,从而将MODRL算法首次应用于混合动力汽车多系统协同优化,结合奖励权重抽样机制,实现多目标权重的自适应选择。本发明所提出的方法能够解决混合动力汽车生态驾驶涉及的多目标权衡问题,从而在提升驾驶和动力性能的同时缩短开发周期。
-