-
公开(公告)号:CN117647996A
公开(公告)日:2024-03-05
申请号:CN202311726576.1
申请日:2023-12-15
Applicant: 扬州大学 , 沈阳飞机设计研究所扬州协同创新研究院有限公司
IPC: G05D1/46 , G05D1/495 , G05D101/15 , G05D109/20
Abstract: 本发明公开了一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统,方法包括:根据飞行器相关系数和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型;通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间;基于参考轨迹,根据变后掠飞行器设计稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数;将LSTM融入强化学习算法,建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。本发明基于参考轨迹,得到的增量模型和动作空间,可以减小动作的探索空间,从而加快收敛速度;加入LSTM的IDDPG算法相对于传统DDPG算法能够更快地收敛到一个更大的平均奖励,结果更加稳定,并且避免在变掠角飞行器的爬升阶段进行不必要的探索。