-
公开(公告)号:CN117572776A
公开(公告)日:2024-02-20
申请号:CN202311693952.1
申请日:2023-12-08
Applicant: 安徽大学
IPC: G05B13/04
Abstract: 本发明是一种未知非线性系统最优跟踪控制的方法、设备及存储介质,其方法包括S100、建立扩展一个受限输入的增广多智能体非线性系统模型;S200、采用传统的基于模型的方法来证明通过求解S100所建立新系统的耦合Hamilton‑Jacobi‑Bellman方程的解得到最优控制策略的可行性;S300、在S200已证明可行性的前提下,对S100建立的扩展系统模型采用无模型强化算法,即利用RL技术,得到了一个无模型Bellman方程,同时通过一种actor‑critic体系结构,得到HJB方程的近似解;S400、最后采用Lyapunov方法,证明系统在采用该无模型强化算法下得到的最优控制策略是稳定的。本发明的无模型强化算法具有灵活性、鲁棒性和高效性,适用于多智能体未知非线性系统的最优跟踪控制问题,并在实际应用中具有较好的表现。
-
公开(公告)号:CN117675594A
公开(公告)日:2024-03-08
申请号:CN202311692315.2
申请日:2023-12-11
Applicant: 安徽大学
IPC: H04L41/12 , H04L41/142
Abstract: 本发明的一种动态网络的有界簇同步方法、设备及存储介质,包括将具有有向切换拓扑的动态系统划分为若干个簇;设计每个代理与虚拟领导者之间的耦合控制器,使得代理能够跟踪虚拟领导者的期望轨迹;通过平均方法将原始的动态系统转化为一个平均系统,使得平均系统具有相同的簇结构和耦合控制器;分析平均系统的稳定性和收敛性,给出关于时间平均拓扑的簇内耦合强度的充分条件,保证有界簇同步的实现;当网络拓扑切换速度达到设定要求时,利用原始系统和平均系统之间的等价关系,将平均系统的簇同步结果推广到原始系统,实现有向切换拓扑动态系统的有界簇同步。本发明的技术方案是通过平均方法将簇同步问题转化为稳定性问题,并给出了收敛性条件。
-