-
公开(公告)号:CN118311878B
公开(公告)日:2024-08-13
申请号:CN202410726196.6
申请日:2024-06-06
Applicant: 吉林大学
IPC: G05B13/04 , G06N3/045 , G06N3/092 , G06N3/084 , G06N3/0985
Abstract: 本发明适用于安全巡逻技术领域,提供了一种基于SAC强化学习算法的智能运动控制方法,包括以下步骤:定义状态空间和动作空间:将起点坐标、当前坐标、终点坐标以及周围环境信息这些状态变量组合成一个状态空间,动作空间包括转向角度和施加在车辆上的加速度;数据收集与预训练:在实际场地进行车辆测试并收集数据用于训练;构建强化学习模型并对模型进行训练;智能巡逻与异常检测。本发明利用智能体的智能运动控制技术和实时监测设备,结合强化学习算法,使智能体能够基于所处环境状态做出最优运动决策,动态调整巡逻路线,优化覆盖范围,并能即时识别并响应异常情况,以解决传统巡逻方法的局限性,提高巡逻效率和安全性。
-
公开(公告)号:CN118311878A
公开(公告)日:2024-07-09
申请号:CN202410726196.6
申请日:2024-06-06
Applicant: 吉林大学
IPC: G05B13/04 , G06N3/045 , G06N3/092 , G06N3/084 , G06N3/0985
Abstract: 本发明适用于安全巡逻技术领域,提供了一种基于SAC强化学习算法的智能运动控制方法,包括以下步骤:定义状态空间和动作空间:将起点坐标、当前坐标、终点坐标以及周围环境信息这些状态变量组合成一个状态空间,动作空间包括转向角度和施加在车辆上的加速度;数据收集与预训练:在实际场地进行车辆测试并收集数据用于训练;构建强化学习模型并对模型进行训练;智能巡逻与异常检测。本发明利用智能体的智能运动控制技术和实时监测设备,结合强化学习算法,使智能体能够基于所处环境状态做出最优运动决策,动态调整巡逻路线,优化覆盖范围,并能即时识别并响应异常情况,以解决传统巡逻方法的局限性,提高巡逻效率和安全性。
-