-
公开(公告)号:CN118778640A
公开(公告)日:2024-10-15
申请号:CN202410759061.X
申请日:2024-06-13
Applicant: 辽宁工程技术大学鄂尔多斯研究院
Abstract: 本发明提供一种无人驾驶安全控制方法,涉及无人驾驶技术领域。该方法首先基于马尔科夫决策过程构建无人驾驶系统控制模型;并采用近端策略优化算法训练深度强化学习智能体;再评估车辆行为的稳定性,在训练深度强化学习智能体的总体目标函数中增加安全约束惩罚函数,以对智能体的行为进行约束;最后通过“专家模型”来指导策略网络学习提高策略网络的学习效率和策略性能。该方法设计强调实时性和适应性,以满足不同应用场景下对速度和准确性的需求,同时通过持续学习优化策略,以适应环境中的不断变化。