-
公开(公告)号:CN117872347B
公开(公告)日:2024-06-21
申请号:CN202410046958.8
申请日:2024-01-12
Applicant: 兰州理工大学
Abstract: 本发明公开了基于双层强化学习优化的JPDA多目标跟踪方法及系统,所述方法包括:S1、在量测周围生成杂波形成复杂环境,在复杂环境中利用深度强化学习对传感器进行路径规划,根据规划的路径找到最佳观测位置,在所述最佳观测位置得到最佳量测信息;S2、基于所述最佳量测信息构件伪关联方程,利用深度强化学习对所述伪关联方程进行优化,得到最佳量测集,对所述最佳量测集进行滤波后验,实现JPDA多目标跟踪。本发明利用强化学习对JPDA关联门内所有候选人量测进行了训练,使得训练后的候选人量测能够有效的提高JPDA算法的估计精度,且双层强化学习优化下的JPDA有着极佳的效果。
-
公开(公告)号:CN117928559A
公开(公告)日:2024-04-26
申请号:CN202410112358.7
申请日:2024-01-26
Applicant: 兰州理工大学
Abstract: 本发明公开了一种基于强化学习的威胁规避下无人机路径规划方法,包括:构建多目标跟踪场景,基于多目标跟踪场景进行目标初始化得到初始化信息;基于初始化信息构建运动状态模型和量测模型;基于运动状态模型和量测模型进行目标运动状态预测得到联合概率和状态预测概率密度;基于状态预测概率密度获取目标状态信息,基于目标状态信息构建下一时刻动作的伪量测,并基于伪量测得到伪更新后的目标状态信息;基于目标实际飞行状态进行目标威胁度评估得到伪更新后的目标威胁度;基于伪更新后的目标状态信息和伪更新后的目标威胁度得到最优决策;基于最优决策进行无人机路径规划。
-
公开(公告)号:CN119575980A
公开(公告)日:2025-03-07
申请号:CN202411737053.1
申请日:2024-11-29
Applicant: 兰州理工大学
IPC: G05D1/43 , G05D1/65 , G05D1/644 , G05D1/686 , G05D109/30
Abstract: 本发明公开了复杂环境下无人水面航行器(USV)最优轨迹规划方法及系统,其中方法步骤包括:对目标进行状态初始化,得到初始状态信息;基于初始状态信息,构建系统模型;构建基于威胁的知识图谱,并推理得到威胁度信息;结合多目标后验克拉美罗下界与威胁度信息,构建评价指标;基于评价指标,完成最优轨迹规划。本发明结合目标和洋流运动态势构建基于海洋威胁的知识图谱。并通过强化学习方法对图谱中的威胁语义信息进行推理,颇为有效地解决了传统威胁评估方法缺乏对威胁特征的自学习能力的缺点,能够深入挖掘评估指标之间的相关性。本发明可以在有效规避目标威胁和洋流扰动的同时优化目标的跟踪效果。
-
公开(公告)号:CN117928559B
公开(公告)日:2024-08-30
申请号:CN202410112358.7
申请日:2024-01-26
Applicant: 兰州理工大学
Abstract: 本发明公开了一种基于强化学习的威胁规避下无人机路径规划方法,包括:构建多目标跟踪场景,基于多目标跟踪场景进行目标初始化得到初始化信息;基于初始化信息构建运动状态模型和量测模型;基于运动状态模型和量测模型进行目标运动状态预测得到联合概率和状态预测概率密度;基于状态预测概率密度获取目标状态信息,基于目标状态信息构建下一时刻动作的伪量测,并基于伪量测得到伪更新后的目标状态信息;基于目标实际飞行状态进行目标威胁度评估得到伪更新后的目标威胁度;基于伪更新后的目标状态信息和伪更新后的目标威胁度得到最优决策;基于最优决策进行无人机路径规划。
-
公开(公告)号:CN116628448A
公开(公告)日:2023-08-22
申请号:CN202310609986.1
申请日:2023-05-26
Applicant: 兰州理工大学
IPC: G06F18/20 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了扩展目标中基于深度强化学习的传感器管理方法,包括:针对椭圆扩展目标进行建模,并根据扩展目标滤波算法构建与深度强化学习的虚拟交互环境;建立TD3算法智能体;将虚拟交互环境与TD3算法智能体进行交互,获取传感器控制数据,并将传感器控制数据作为样本存放至经验回放池;基于经验回放池抽取样本,训练TD3算法智能体,通过训练后的智能体决策出传感器路径规划最优动作;将最优动作作用于传感器,传感器发生状态转移后获得传感器位置,由此获取当前时刻扩展目标传感器量测值,并进行滤波的预测和更新,进行扩展目标的跟踪估计。本发明在整体上优化了椭圆扩展目标的跟踪效果。
-
公开(公告)号:CN117872347A
公开(公告)日:2024-04-12
申请号:CN202410046958.8
申请日:2024-01-12
Applicant: 兰州理工大学
Abstract: 本发明公开了基于双层强化学习优化的JPDA多目标跟踪方法及系统,所述方法包括:S1、在量测周围生成杂波形成复杂环境,在复杂环境中利用深度强化学习对传感器进行路径规划,根据规划的路径找到最佳观测位置,在所述最佳观测位置得到最佳量测信息;S2、基于所述最佳量测信息构件伪关联方程,利用深度强化学习对所述伪关联方程进行优化,得到最佳量测集,对所述最佳量测集进行滤波后验,实现JPDA多目标跟踪。本发明利用强化学习对JPDA关联门内所有候选人量测进行了训练,使得训练后的候选人量测能够有效的提高JPDA算法的估计精度,且双层强化学习优化下的JPDA有着极佳的效果。
-
公开(公告)号:CN116628448B
公开(公告)日:2023-11-28
申请号:CN202310609986.1
申请日:2023-05-26
Applicant: 兰州理工大学
IPC: G06F18/20 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了扩展目标中基于深度强化学习的传感器管理方法,包括:针对椭圆扩展目标进行建模,并根据扩展目标滤波算法构建与深度强化学习的虚拟交互环境;建立TD3算法智能体;将虚拟交互环境与TD3算法智能体进行交互,获取传感器控制数据,并将传感器控制数据作为样本存放至经验回放池;基于经验回放池抽取样本,训练TD3算法智能体,通过训练后的智能体决策出传感器路径规划最优动作;将最优动作作用于传感器,传感器发生状态转移后获得传感器位置,由此获取当前时刻扩展目标传感器量测值,并进行滤波的预测和更新,进行扩展目标的跟踪估计。本发明在整体上优化了椭圆扩展目标的跟踪效果。
-
-
-
-
-
-