基于双层强化学习优化的JPDA多目标跟踪方法及系统

    公开(公告)号:CN117872347B

    公开(公告)日:2024-06-21

    申请号:CN202410046958.8

    申请日:2024-01-12

    Abstract: 本发明公开了基于双层强化学习优化的JPDA多目标跟踪方法及系统,所述方法包括:S1、在量测周围生成杂波形成复杂环境,在复杂环境中利用深度强化学习对传感器进行路径规划,根据规划的路径找到最佳观测位置,在所述最佳观测位置得到最佳量测信息;S2、基于所述最佳量测信息构件伪关联方程,利用深度强化学习对所述伪关联方程进行优化,得到最佳量测集,对所述最佳量测集进行滤波后验,实现JPDA多目标跟踪。本发明利用强化学习对JPDA关联门内所有候选人量测进行了训练,使得训练后的候选人量测能够有效的提高JPDA算法的估计精度,且双层强化学习优化下的JPDA有着极佳的效果。

    复杂环境下无人水面航行器最优轨迹规划方法及系统

    公开(公告)号:CN119575980A

    公开(公告)日:2025-03-07

    申请号:CN202411737053.1

    申请日:2024-11-29

    Abstract: 本发明公开了复杂环境下无人水面航行器(USV)最优轨迹规划方法及系统,其中方法步骤包括:对目标进行状态初始化,得到初始状态信息;基于初始状态信息,构建系统模型;构建基于威胁的知识图谱,并推理得到威胁度信息;结合多目标后验克拉美罗下界与威胁度信息,构建评价指标;基于评价指标,完成最优轨迹规划。本发明结合目标和洋流运动态势构建基于海洋威胁的知识图谱。并通过强化学习方法对图谱中的威胁语义信息进行推理,颇为有效地解决了传统威胁评估方法缺乏对威胁特征的自学习能力的缺点,能够深入挖掘评估指标之间的相关性。本发明可以在有效规避目标威胁和洋流扰动的同时优化目标的跟踪效果。

    扩展目标中基于深度强化学习的传感器管理方法

    公开(公告)号:CN116628448A

    公开(公告)日:2023-08-22

    申请号:CN202310609986.1

    申请日:2023-05-26

    Abstract: 本发明公开了扩展目标中基于深度强化学习的传感器管理方法,包括:针对椭圆扩展目标进行建模,并根据扩展目标滤波算法构建与深度强化学习的虚拟交互环境;建立TD3算法智能体;将虚拟交互环境与TD3算法智能体进行交互,获取传感器控制数据,并将传感器控制数据作为样本存放至经验回放池;基于经验回放池抽取样本,训练TD3算法智能体,通过训练后的智能体决策出传感器路径规划最优动作;将最优动作作用于传感器,传感器发生状态转移后获得传感器位置,由此获取当前时刻扩展目标传感器量测值,并进行滤波的预测和更新,进行扩展目标的跟踪估计。本发明在整体上优化了椭圆扩展目标的跟踪效果。

    基于双层强化学习优化的JPDA多目标跟踪方法及系统

    公开(公告)号:CN117872347A

    公开(公告)日:2024-04-12

    申请号:CN202410046958.8

    申请日:2024-01-12

    Abstract: 本发明公开了基于双层强化学习优化的JPDA多目标跟踪方法及系统,所述方法包括:S1、在量测周围生成杂波形成复杂环境,在复杂环境中利用深度强化学习对传感器进行路径规划,根据规划的路径找到最佳观测位置,在所述最佳观测位置得到最佳量测信息;S2、基于所述最佳量测信息构件伪关联方程,利用深度强化学习对所述伪关联方程进行优化,得到最佳量测集,对所述最佳量测集进行滤波后验,实现JPDA多目标跟踪。本发明利用强化学习对JPDA关联门内所有候选人量测进行了训练,使得训练后的候选人量测能够有效的提高JPDA算法的估计精度,且双层强化学习优化下的JPDA有着极佳的效果。

    扩展目标中基于深度强化学习的传感器管理方法

    公开(公告)号:CN116628448B

    公开(公告)日:2023-11-28

    申请号:CN202310609986.1

    申请日:2023-05-26

    Abstract: 本发明公开了扩展目标中基于深度强化学习的传感器管理方法,包括:针对椭圆扩展目标进行建模,并根据扩展目标滤波算法构建与深度强化学习的虚拟交互环境;建立TD3算法智能体;将虚拟交互环境与TD3算法智能体进行交互,获取传感器控制数据,并将传感器控制数据作为样本存放至经验回放池;基于经验回放池抽取样本,训练TD3算法智能体,通过训练后的智能体决策出传感器路径规划最优动作;将最优动作作用于传感器,传感器发生状态转移后获得传感器位置,由此获取当前时刻扩展目标传感器量测值,并进行滤波的预测和更新,进行扩展目标的跟踪估计。本发明在整体上优化了椭圆扩展目标的跟踪效果。

Patent Agency Ranking