-
公开(公告)号:CN118551482A
公开(公告)日:2024-08-27
申请号:CN202410915381.X
申请日:2024-07-09
Applicant: 南开大学
Abstract: 本发明涉及非电变量的控制或调节系统技术领域,尤其涉及一种多拦截飞行器协同突防博弈制导律设计方法,包括如下步骤:建立三维相对运动模型;设定存在时间#imgabs0#使各拦截飞行器在#imgabs1#内的一个时间点达到预设制导效果;为各拦截飞行器设定状态空间、动作空间及奖励函数;初始化状态空间、动作空间、奖励函数及网络参数;对各拦截飞行器在每一个设定的时间步内根据当前actor网络及状态选择动作,并将经验元组数据进行存储;随机抽取经验元组数据对网络进行学习,并更新网络;重复迭代直至设计的动作使各拦截飞行器达到预设制导效果。本发明提供的方法具有高度的适应性,强大的决策能力以及协同效率,方案先进且灵活有效。
-
公开(公告)号:CN119645082A
公开(公告)日:2025-03-18
申请号:CN202510162972.9
申请日:2025-02-14
Applicant: 南开大学
Abstract: 本发明涉及编队飞行控制技术领域,提供一种基于成本敏感元强化学习的编队飞行控制方法和系统。该方法主要包括以下步骤:建立编队飞行三维运动学模型;构建编队飞行控制方法的设定目标;根据所述编队飞行三维运动学模型和编队飞行控制方法的设定目标构建编队飞行控制模型;根据成本敏感元强化学习对编队飞行控制模型进行训练,得到最终元策略参数。本发明通过在元强化学习内采取层次化优化策略,实现了在复杂编队控制动态环境中的快速适应和安全性保证。
-