-
公开(公告)号:CN118707950A
公开(公告)日:2024-09-27
申请号:CN202410700690.5
申请日:2024-05-31
Applicant: 上海大学
Abstract: 本发明涉及一种多车自动驾驶博弈协同定向规划方法、装置及介质,方法包括以下步骤:将车队按次序排列,第一辆车设置为领导者,将后续车辆均设置为跟随者;将环境状态信息和车辆间的位置信息作为状态量输入设计的模糊深度网络;通过模糊深度网络,根据环境状态和贪心策略选择领导者的最优动作,根据领导者、环境状态和前序的跟随者依次选择各个跟随者的最优动作,得到联合状态动作,计算此时的Stackelberg均衡下的累计奖励值,根据累计奖励值更新模糊深度网络的参数;车队按照联合状态动作前进,并转移到下一时刻的状态,重复迭代,直到车队通过路口。与现有技术相比,本发明具有通过效率高、预测精度高等优点。
-
公开(公告)号:CN117970939A
公开(公告)日:2024-05-03
申请号:CN202410117396.1
申请日:2024-01-26
Applicant: 上海大学
IPC: G05D1/46 , G05D109/20
Abstract: 本发明涉及无人机容错跟踪技术领域。提出一种面向欺骗攻击的无人机Stacke lberg博弈容错跟踪方法及系统。该方法包括构造无人机动力学模型;对无人机的跟踪误差进行规定性能控制以构造无人机误差动力学模型;根据无人机误差动力学模型构造Stacke lberg博弈问题;以及通过演员‑评论家算法对Stacke lberg博弈问题进行求解以确定无人机的控制方法,并且通过所述控制方法进行无人机容错跟踪。本发明显著降低了无人机系统行为不确定性的风险,增进系统的安全性和稳定性,实现了对无人机容错跟踪的稳定控制,显著提高了系统的鲁棒性。
-
公开(公告)号:CN115903820A
公开(公告)日:2023-04-04
申请号:CN202211507056.7
申请日:2022-11-29
Applicant: 上海大学
IPC: G05D1/02
Abstract: 本发明提供了一种多无人艇追逃博弈控制方法,包括:无人艇追逃时,在追击方的控制算法中引入序贯决策,进行“自我博弈”;观测器根据控制器给出的最优控制,解算观测器的最优响应,以逼近追击方群体中的外部干扰及系统不确定性;以及控制器接收观测器的最优响应,根据所述最优响应重新解算追击方的最优控制,如此交替进行,形成序贯决策;在该序贯决策基础之上,设计一种新型奖励函数形式并应用强化学习控制算法,完成多无人艇围捕任务。
-
公开(公告)号:CN115793455A
公开(公告)日:2023-03-14
申请号:CN202211507269.X
申请日:2022-11-29
Applicant: 上海大学
IPC: G05B13/04
Abstract: 本发明提供了一种基于Actor‑Critic‑Advantage网络的无人艇轨迹跟踪控制方法,包括:在Actor‑Critic网络基础上引入优势函数估计网络,形成新型Actor‑Critic‑Advantage网络;训练新型Actor‑Critic‑Advantage网络进行无人艇轨迹跟踪控制;无人艇轨迹跟踪训练采用单步获取策略梯度方式,利用优势函数估计网络输出值得到策略梯度更新策略网络;基于反步法求解虚拟控制律设计分段奖励函数;奖励函数中引入虚拟控制律,训练无人艇的速度输出趋向于虚拟控制律。
-
-
-