-
公开(公告)号:CN116394968A
公开(公告)日:2023-07-07
申请号:CN202211546947.3
申请日:2022-12-05
Applicant: 北京理工大学
IPC: B60W60/00 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/092 , B60W50/00 , B60W40/08
Abstract: 本发明涉及一种基于多智能体强化学习的自动驾驶车辆控制方法,属于人工智能和自动驾驶技术领域。针对自动驾驶车辆场景,本方法提出了一个用于AVs的多智能体自适应决策框架。首先考虑乘客的个性化需求,为AVs制定不同的驾驶风格,用于后续决策建模过程中。利用联盟博弈和V2V通信,以每个网联自动驾驶车辆CAV为中心划分多智能体系统,从而构建合作决策区域。然后,基于模型预测控制中的滚动时域,构建了一个深度强化学习决策框架,以实现CAV在合作区域里的运动决策。在完全自动驾驶车辆的场景下,本发明不仅能够保证在高速主干车道上的安全性和效率,而且对于匝道合流区域的安全性、舒适度和效率也能够得到保障。
-
公开(公告)号:CN115618738A
公开(公告)日:2023-01-17
申请号:CN202211340151.2
申请日:2022-10-28
Applicant: 北京理工大学
IPC: G06F30/27 , G06F119/02
Abstract: 本发明涉及一种基于两方博弈的无人系统主动目标监控方法,属于人工智能与目标监控技术领域。本方法充分考虑了目标监控任务中的目标运动的不确定性和对抗性,以及长时间监控中的监控能力,基于两方博弈构建了两个独立智能体交互过程,将整个监控过程分为监控阶段和搜索阶段,分别设计奖励函数。通过提升目标策略的多样性,实现监控者的奖励提升,从而延长监控过程的持续时间,减少搜索过程时间,提升了监控者在长时间监控任务中的监控性能。
-
公开(公告)号:CN115542945A
公开(公告)日:2022-12-30
申请号:CN202211331938.2
申请日:2022-10-28
Applicant: 北京理工大学
IPC: G05D1/10
Abstract: 本发明涉及一种自适应调整范围的无人机群目标三维持续监控方法,属于无人机目标监控技术领域。本方法针对基于视觉检测的单无人机群目标三维持续监控问题,利用了有权图结构对群目标进行建模,在水平方向上,通过寻找中心位置进行飞行决策,在高度方向上,利用离线数据集结合离线强化学习算法,在考无人机虑能耗及视觉系准确率的情况下,实现自适应飞行高度决策。本方法能够自适应的调整无人机的检测范围,有效提升了单个无人机的监控性能。
-
-