-
公开(公告)号:CN114003063A
公开(公告)日:2022-02-01
申请号:CN202111652645.X
申请日:2021-12-31
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本发明提供一种飞行器的控制方法及装置。所述方法包括:根据高阶奇异值分解法,对连续的飞行器的状态空间方程进行离散化处理,得到离散的飞行器顶点模型;确定飞行器的控制器和飞行器顶点模型构成的闭环控制系统满足性能指标,以及确定飞行器的控制器和飞行器顶点模型构成的闭环控制系统满足性能指标,得到优化后的控制器;根据优化后的控制器对飞行器进行控制。本发明提供的飞行器的控制方法及装置,通过将混合和性能设计的控制应用于飞行器的控制器中,结合了和两种性能的优点,对飞行器的控制器进行优化,使得飞行器不仅能有效的处理飞行器控制系统外部的随机噪声以及干扰,并且使得飞行器控制系统内部具有较好的鲁棒性。
-
公开(公告)号:CN113253610A
公开(公告)日:2021-08-13
申请号:CN202110422539.6
申请日:2021-04-20
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
Abstract: 本发明实施例提供一种飞行器控制方法及装置,该方法综合应用参数估计误差和状态跟踪误差来设计自适应律,并在自适应律中进一步加入鲁棒修正项,不仅实现了对非线性系统的参数不确定性和非参数不确定性的同时处理,而且能够提高对参数化不确定性项的收敛速度,增强对非参数化不确定性项的鲁棒抑制,有利于减小跟踪误差,提高控制精度,进而提高了飞行器的控制效果。
-
公开(公告)号:CN113128657A
公开(公告)日:2021-07-16
申请号:CN202110669818.2
申请日:2021-06-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多智能体行为决策方法、装置、电子设备和存储介质,其中方法包括:基于多智能体行为模型中的图生成模块,将各个智能体及其对应的环境信息构建为图;基于多智能体行为模型中的信息传递模块,对各个智能体及其对应的环境信息进行编码,得到各个智能体对应的联合编码状态;基于多智能体行为模型中的策略优化模块,结合各个智能体对应的联合编码状态,确定各个智能体的初始决策;基于多智能体行为模型中的碰撞避免模块,对各个智能体的初始决策进行变步长控制,并结合各个智能体对应的斥力,确定各个智能体的最终决策。本发明解决了大规模智能体场景下强化学习难以收敛的问题,实现了多智能体系统下高性能的自主决策能力和避碰效果。
-
公开(公告)号:CN116382326A
公开(公告)日:2023-07-04
申请号:CN202310125512.X
申请日:2023-02-14
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本发明涉及飞行器控制技术领域,尤其涉及一种飞行器六自由度控制模型的训练方法和飞行器控制方法。其中,控制模型的训练方法包括,首先获取飞行器在六自由度控制模型下的第一控制参数和飞行器的第一状态信息;然后将第一控制参数和飞行器的自身状态信息输入到初始六自由度控制模型中,得到第二控制参数;根据第二控制参数控制飞行器运行,同时获取飞行器的第二状态信息;最后根据飞行器的第二状态信息计算奖励函数值,根据奖励函数值更新初始六自由度控制模型的模型参数,以得到训练好的六自由度控制模型。基于训练好的六自由度控制模型实现对飞行器的控制,可以提高飞行器的控制精度,同时具备良好的抗干扰性能和鲁棒性。
-
公开(公告)号:CN115793717A
公开(公告)日:2023-03-14
申请号:CN202310104054.1
申请日:2023-02-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种群体协同决策方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法包括:基于目标无人机的局部观测信息得到观测表征向量;基于目标无人机的局部通信信息得到交互表征向量;融合观测表征向量及交互表征向量,得到环境表征向量;基于环境表征向量对目标无人机进行群体协同策略更新,由此通过根据融合后得到的环境表征向量进行群体协同策略进行更新,得到最优运行策略,以根据最优运行策略完成协同围捕任务,实现了有效地处理群体系统中无人机动态多变的局部观测信息和局部通信信息,促进无人机之间合作,提高无人机在动态变化环境下的协同围捕决策能力。
-
公开(公告)号:CN113985924B
公开(公告)日:2022-04-08
申请号:CN202111608105.1
申请日:2021-12-27
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本申请提供一种飞行器控制方法、装置、设备及计算机程序产品,该方法包括:根据飞行器模型中的模型参数,确定飞行器的观测量数据和智能体动作数据;基于观测量数据或/和智能体动作数据,对actor网络和critic网络进行训练,输出确定性策略和动作值函数;通过深度确定性策略梯度算法对actor网络参数和critic网络参数进行更新,得到最优actor网络和最优critic网络;基于最优actor网络和最优critic网络构建在线控制器,通过在线控制器对飞行器进行控制。本申请实施例提供的飞行器控制方法通过深度确定性策略梯度算法离线训练在线控制器,使得在线控制器具有良好的适应性和鲁棒性,实现飞行器精准控制。
-
公开(公告)号:CN113985924A
公开(公告)日:2022-01-28
申请号:CN202111608105.1
申请日:2021-12-27
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本申请提供一种飞行器控制方法、装置、设备及计算机程序产品,该方法包括:根据飞行器模型中的模型参数,确定飞行器的观测量数据和智能体动作数据;基于观测量数据或/和智能体动作数据,对actor网络和critic网络进行训练,输出确定性策略和动作值函数;通过深度确定性策略梯度算法对actor网络参数和critic网络参数进行更新,得到最优actor网络和最优critic网络;基于最优actor网络和最优critic网络构建在线控制器,通过在线控制器对飞行器进行控制。本申请实施例提供的飞行器控制方法通过深度确定性策略梯度算法离线训练在线控制器,使得在线控制器具有良好的适应性和鲁棒性,实现飞行器精准控制。
-
公开(公告)号:CN113962032A
公开(公告)日:2022-01-21
申请号:CN202111566939.0
申请日:2021-12-21
Applicant: 中国科学院自动化研究所
IPC: G06F30/15 , G06F30/20 , G06F17/16 , G06F119/12
Abstract: 本发明提供一种空战机动决策方法及装置,所述方法包括:根据飞行器实际性能限制因素,构建飞行器空战模型;根据在飞行控制系统控制下的飞行器状态的动态响应的时间,分别为不同的飞行器状态设置不同的决策周期;根据在设置决策周期后的飞行器状态,分别确定不同的飞行器状态对应的目标空战机动指令;根据目标空战机动指令和飞行器空战模型,对飞行器进行空战机动决策;其中,飞行器状态包括:高度、航向角和速度。本发明提供的空战机动决策方法及装置,通过不同的飞行器状态在控制系统下的动态响应特性,分别为不同的飞行器状态的机动决策设置不同的决策周期,可有效减轻空战机动决策实时性和准确性之间的矛盾,实现快速高效的空战机动决策。
-
公开(公告)号:CN113253610B
公开(公告)日:2021-10-01
申请号:CN202110422539.6
申请日:2021-04-20
Applicant: 中国科学院自动化研究所
IPC: G05B13/04
Abstract: 本发明实施例提供一种飞行器控制方法及装置,该方法综合应用参数估计误差和状态跟踪误差来设计自适应律,并在自适应律中进一步加入鲁棒修正项,不仅实现了对非线性系统的参数不确定性和非参数不确定性的同时处理,而且能够提高对参数化不确定性项的收敛速度,增强对非参数化不确定性项的鲁棒抑制,有利于减小跟踪误差,提高控制精度,进而提高了飞行器的控制效果。
-
公开(公告)号:CN113253738A
公开(公告)日:2021-08-13
申请号:CN202110689055.8
申请日:2021-06-22
Applicant: 中国科学院自动化研究所
IPC: G05D1/02
Abstract: 本发明提供一种多机器人协作围捕方法、装置、电子设备及存储介质,其中方法包括:基于任一机器人的运动状态,任一机器人与目标物体之间的距离,以及任一机器人与其余各个机器人之间的距离,确定任一机器人的围捕状态信息;基于任一机器人与各个障碍物体之间的距离,以及各个障碍物体的状态,确定任一机器人的障碍状态信息;基于每一机器人的围捕状态信息和障碍状态信息,确定每一机器人的运动控制策略;基于每一机器人的运动控制策略,控制各个机器人对所述目标物体进行围捕。本发明提供的方法、装置、电子设备及存储介质,提高了多机器人系统的安全性,围捕目标不易于逃脱,提高了围捕效果。
-
-
-
-
-
-
-
-
-