-
公开(公告)号:CN117208019B
公开(公告)日:2024-04-05
申请号:CN202311473564.2
申请日:2023-11-08
Applicant: 北京理工大学前沿技术研究院 , 北京理工大学
IPC: B60W60/00 , G06N3/092 , G06F18/213 , G06F18/25 , B60W30/095 , B60W50/00
Abstract: 本发明提供了一种基于值分布强化学习的感知遮挡下纵向决策方法及系统,属于车辆驾驶决策技术领域,获取目标区域的人员识别结果,获取其中的位置信息和速度信息;获取目标区域的环境信息;利用融合谨慎心驱动的值分布式强化学习模型,基于所述环境信息、位置信息和速度信息,预测人员的下一步动作和位置,并依据预测结果,生成纵向决策;融合谨慎心驱动的值分布式强化学习模型包括用于确定相关分位数下的奖励的效率分位数函数,利用谨慎心驱动更新所述函数与环境信息互动后的奖励。本发明基于分布式强化学习与谨慎心驱动方法相融合,有效提升了车辆的通行安全和效率以及算法的泛化能力。
-
公开(公告)号:CN117666559B
公开(公告)日:2024-07-02
申请号:CN202311468384.5
申请日:2023-11-07
Applicant: 北京理工大学前沿技术研究院 , 北京理工大学
IPC: G05D1/43
Abstract: 本发明公开一种自主车辆横纵向决策路径规划方法、系统、设备及介质,涉及车辆驾驶决策技术领域,包括:在全局路径导航下,基于道路中心线采样偏移量,得到每个步长的位置点;以自主车辆和环境车辆的位置和速度为状态观测量,以在每个步长下所选的位置点为动作量构建横向决策模型,以油门踏板开度和刹车踏板开度为动作量构建纵向决策模型,设计奖励函数,对横向决策模型和纵向决策模型进行训练;根据训练后的横向决策模型选择每个步长的最优位置点,并对每个步长的最优位置点经多项式拟合后得到局部路径轨迹;基于局部路径轨迹,根据训练后的纵向决策模型得到速度控制量,提升在感知遮挡下的决策规划效果。
-
公开(公告)号:CN114719850A
公开(公告)日:2022-07-08
申请号:CN202210226742.0
申请日:2022-03-09
Applicant: 北京理工大学 , 北京理工大学前沿技术研究院
Abstract: 本发明公开了一种基于多层感知和容积卡尔曼滤波的姿态估计多频数据融合方法,基于局部加权线性回归(LWLR)、多层感知(MLP)和容积卡尔曼滤波器。本发明建立视觉和惯性数据的滤波方程,采用CKF利用一组立方点来近似非线性函数的概率分布;采用LWLR线性回归方法,利用高斯核函数对内存中测量点附近的点赋予较高的权值,求解最小均方差的无偏估计;将视觉差异作为MLP的输入,并通过隐层的激活函数,将这种差异视作和的权重,用来补偿惯性数据,解决多频融合固有的散度。本发明在姿态估计精度和发散能力方面具有较好的性能表现。
-
公开(公告)号:CN117666559A
公开(公告)日:2024-03-08
申请号:CN202311468384.5
申请日:2023-11-07
Applicant: 北京理工大学前沿技术研究院 , 北京理工大学
IPC: G05D1/43
Abstract: 本发明公开一种自主车辆横纵向决策路径规划方法、系统、设备及介质,涉及车辆驾驶决策技术领域,包括:在全局路径导航下,基于道路中心线采样偏移量,得到每个步长的位置点;以自主车辆和环境车辆的位置和速度为状态观测量,以在每个步长下所选的位置点为动作量构建横向决策模型,以油门踏板开度和刹车踏板开度为动作量构建纵向决策模型,设计奖励函数,对横向决策模型和纵向决策模型进行训练;根据训练后的横向决策模型选择每个步长的最优位置点,并对每个步长的最优位置点经多项式拟合后得到局部路径轨迹;基于局部路径轨迹,根据训练后的纵向决策模型得到速度控制量,提升在感知遮挡下的决策规划效果。
-
公开(公告)号:CN117208019A
公开(公告)日:2023-12-12
申请号:CN202311473564.2
申请日:2023-11-08
Applicant: 北京理工大学前沿技术研究院 , 北京理工大学
IPC: B60W60/00 , G06N3/092 , G06F18/213 , G06F18/25 , B60W30/095 , B60W50/00
Abstract: 本发明提供了一种基于值分布强化学习的感知遮挡下纵向决策方法及系统,属于车辆驾驶决策技术领域,获取目标区域的人员识别结果,获取其中的位置信息和速度信息;获取目标区域的环境信息;利用融合谨慎心驱动的值分布式强化学习模型,基于所述环境信息、位置信息和速度信息,预测人员的下一步动作和位置,并依据预测结果,生成纵向决策;融合谨慎心驱动的值分布式强化学习模型包括用于确定相关分位数下的奖励的效率分位数函数,利用谨慎心驱动更新所述函数与环境信息互动后的奖励。本发明基于分布式强化学习与谨慎心驱动方法相融合,有效提升了车辆的通行安全和效率以及算法的泛化能力。
-
公开(公告)号:CN114781072A
公开(公告)日:2022-07-22
申请号:CN202210683994.6
申请日:2022-06-17
Applicant: 北京理工大学前沿技术研究院 , 山东伟创信息技术有限公司
IPC: G06F30/15 , G06F30/27 , G06N3/04 , G06N3/08 , G06N7/00 , B60W60/00 , B60W30/18 , B60W50/00 , G06F111/08 , G06F119/12
Abstract: 本发明提出了一种无人驾驶车辆的决策方法和系统,该方法包括获取交叉口环境下第一时刻观测状态;将第一时刻观测状态扩展出的时序观测状态输入至训练完成的第一神经网络中输出目标车辆的确定性动作;接收时序观测状态,并将预测信息输入马尔科夫模型中,以及将深度确定性策略梯度算法中的全连接神经网络修改为LSTM神经网络形成基于时序的决策模型,计算确定性动作后决策模型的奖励值;获取第二时刻观测状态共同形成预测信息,更新时序观测状态,重新执行决策模型,更新奖励值直到目标车辆穿越交叉口环境。基于该方法,还提出了决策系统。本发明融合元探索学习算法与时间双延迟深度确定性策略梯度算法,有效提升车辆通行安全和效率。
-
公开(公告)号:CN113296515A
公开(公告)日:2021-08-24
申请号:CN202110568228.0
申请日:2021-05-25
Applicant: 北京理工大学
IPC: G05D1/02
Abstract: 本发明涉及无人车路径跟踪控制技术领域,具体地说,涉及一种双独立电驱动车辆显式模型预测路径跟踪方法。包括以下步骤:环境感知:对车辆附近的环境信息进行收集并处理;路径规划:对环境感知的信息和车辆本身的状态进行规划可行期望路径,并采用显式模型预测控制算法对双独立电驱动车辆进行路径跟踪控制;运动控制:对路径规划的信息进行接收,并结合车辆当前状态,计算控制指令;显式模型预测控制算法包括离线求解和在线查询,且离线求解和在线查询的算法均用于计算线性定常系统。本发明通过采用显式模型预测控制的算法对双独立电驱动车辆进行路径跟踪控制,降低采样周期时长,保证车辆及时反馈当前状态并下达控制指令。
-
-
-
-
-
-