-
公开(公告)号:CN117590744A
公开(公告)日:2024-02-23
申请号:CN202311488926.5
申请日:2023-11-09
Applicant: 安徽大学
IPC: G05B13/04
Abstract: 本发明提出了一种非线性网络控制系统多目标协同最优控制方法,竞争神经网络将被控系统状态、控制器接收到的传感器数据和目标构成的增广状态作为输入,经过特征表征网络,分别输入状态值函数网络、连续控制策略网络和优势值函数网络。状态值函数网络输出不同通讯网络模式下的状态值函数。连续控制策略网络输出不同通讯网络模式下的连续控制信号。优势值函数采用标准正态分布形式,输出不同通讯网络模式下的优势值函数。通过更新竞争网络同时对离散网络调度策略和连续控制策略协同优化。本发明协同优化非线性系统的网络调度策略和被控对象的控制策略,实现全局最优,本发明可以有效处理多目标学习任务,提高策略对不同任务的泛化能力。
-
公开(公告)号:CN116817909A
公开(公告)日:2023-09-29
申请号:CN202310280577.1
申请日:2023-03-22
Applicant: 安徽大学
Abstract: 本发明公开了一种基于深度强化学习的无人机中继式导航方法,包括:收集无人机在执行中继式导航任务时的无人机状态向量;构建深度强化学习网络,依次将无人机状态向量输入深度强化学习网络中,输出最优参数化动作,并根据最优参数化动作进行原始经验存储和原始经验扩充,更新深度强化学习网络,直至达到最大训练回合数,完成对深度强化学习网络的训练;重新获取一架无人机状态向量,输入到训练好的深度强化学习网络中,得到无人机的最优参数化动作,通过无人机的最优参数化动作指引无人机中继式导航。本发明在多阶段导航这类中继式任务中自主规划无人机路径,实现导航过程。
-