基于随机广义纳什均衡搜索的多发电站博弈方法及设备

    公开(公告)号:CN118473019A

    公开(公告)日:2024-08-09

    申请号:CN202410570586.9

    申请日:2024-05-09

    Abstract: 本发明涉及发电站市场竞争领域,具体是涉及基于随机广义纳什均衡搜索的多发电站博弈方法及设备。本发明获取若干发电站的约束条件和发电成本,基于所述若干发电站的约束条件和发电成本构建若干发电站的能源分配问题,其中,所述能源分配问题为分布式的随机广义纳什均衡问题,所述随机广义纳什均衡问题的状态变量包括决策变量、对偶变量和辅助变量;通过方差缩减算子分裂算法求解所述能源分配问题,以得到目标发电站的目标策略。本发明通过在发电站市场竞争场景的策略制定中引入方差缩减与算子分裂技术,提升对于策略计算过程中梯度估计的精确性和计算收敛速度,以实现发电站在有限信息条件下参与发电站市场能源分配利益最大化。

    四旋翼无人机仿射编队控制方法、系统、电子设备及介质

    公开(公告)号:CN117193375A

    公开(公告)日:2023-12-08

    申请号:CN202311360833.4

    申请日:2023-10-20

    Abstract: 本发明公开一种四旋翼无人机仿射编队控制方法、系统、电子设备及介质,涉及无人机飞行控制技术领域。所述方法包括:根据仿射变换理论确定目标无人机编队中的领航者、跟随者以及通信拓扑结构图;根据图确定符号拉普拉斯矩阵、各无人机的入邻居节点集合;若领航者为常值加速度,根据矩阵、跟随者和集合中各无人机传输的物理参数以及第一位置控制器,得到控制力;若领航者为时变加速度,根据矩阵、集合中各无人机的估计量参数、状态观测器、物理参数以及第二位置控制器,得到控制力;根据控制力以及自适应滑膜姿态控制器得到控制力矩;将控制力和控制力矩对跟随者控制。本发明使得无人机集群在编队中具有更强的抗扰能力并可实现更灵活的队形机动。

    一种异构无人集群系统的强化学习最优输出跟踪控制方法

    公开(公告)号:CN116974195A

    公开(公告)日:2023-10-31

    申请号:CN202310914911.4

    申请日:2023-07-24

    Abstract: 本发明涉及一种异构无人集群系统的强化学习最优输出跟踪控制方法,属于多无人系统技术领域。为实现异构无人集群系统的最优输出跟踪控制目标,提出一种新颖的分层控制方案,在分布式层,设计一个预设时间的完全分布式观测器,在给定的时间内精确地估计领导者的状态。在分散式层,设计一个基于强化学习的数据驱动跟踪控制器追踪估计的领导者状态。与现有方法相比,所设计的预设时间的完全分布式观测器的收敛时间完全由设计者决定,并且在设计过程中不使用全局的拓扑信息。此外,提出一种基于数据的初始稳定控制策略学习算法来获得一个初始稳定控制策略,摆脱了现有强化学习方法中需要初始稳定控制策略预先已知的限制条件。

    一种欺骗攻击下集群无人系统的自适应协同安全控制方法

    公开(公告)号:CN116736696A

    公开(公告)日:2023-09-12

    申请号:CN202310451528.X

    申请日:2023-04-25

    Abstract: 本发明公开了一种欺骗攻击下集群无人系统的自适应协同安全控制方法,涉及多无人系统技术领域,能够在资源受限的通信网络中实现安全有效的数据传输、且可以在具有欺骗攻击的情况下保证系统的稳定性。其中集群无人系统由N个无人系统组成,各无人系统之间通过一个有向图进行通信;针对集群无人系统的自适应协同安全控制方法包括如下步骤:建立多无人系统模型。考虑欺骗攻击对网络传输的数据的影响,建立已有欺骗攻击模型。基于欺骗攻击模型,设计基于量化器的编解码机制,进而构造控制器。基于现有的标准Lyapunov扩展定理,得到确保系统稳定的充分条件,在满足充分条件的基础上,采用控制器用于集群无人系统的自适应协同安全控制。

    模型未知下无人车集群系统的辨识与自学习协同控制方法

    公开(公告)号:CN116700257A

    公开(公告)日:2023-09-05

    申请号:CN202310672993.6

    申请日:2023-06-08

    Abstract: 本发明公开了模型未知下无人车集群系统的辨识与自学习协同控制方法,涉及多无人系统技术领域,首先,针对系统模型完全未知,本发明利用强化学习和数据驱动控制联合使用设计一种强化学习的系统模型辨识和重构方法;其次,设计了基于强化学习的最优协同控制方案,并提出了一种仅依赖在线状态信息和输入信息的在线自适应学习协同控制算法学习到最优的控制策略,通过Lyapunov稳定性分析方法,在最优的控制策略的作用下保证了跟随无人车能够实现对领航无人车的最优跟踪;本发明提供的模型辨识与强化学习的协同控制方法完全放松了传统跟踪控制协议中依赖车辆动力学的要求,同时实现了高效的协同路径跟踪控制。

    动态环境下异构无人集群系统的路径规划与协同控制方法

    公开(公告)号:CN119556730A

    公开(公告)日:2025-03-04

    申请号:CN202411728774.6

    申请日:2024-11-28

    Abstract: 本发明公开了一种动态环境下异构无人集群系统的路径规划与协同控制方法。首先构建预定义时间的分布式位置观测器,利用无人机之间的局部信息交互估计每个跟随者无人机的初始和最终编队目标位置。构建基于自适应可变解空间RRT算法的全局路径规划器,规划各个无人机穿越密集障碍区域时的安全全局路径;构建基于预定义时间预测滤波器的局部路径规划器,避免无人机在编队跟踪中与动态障碍的潜在碰撞风险;最后根据安全全局路径和局部路径规划结果,采用滑模控制方法,对无人机进行运动控制,实现无人机集群的固定时间编队跟踪控制。使用本发明能够使多无人机系统实现复杂动态环境中的安全飞行,且保证实现编队跟踪飞行任务时的控制性能。

    弱信息交互下异构无人集群系统自适应协同控制方法

    公开(公告)号:CN119002289B

    公开(公告)日:2025-01-21

    申请号:CN202411475752.3

    申请日:2024-10-22

    Abstract: 本发明公开了弱信息交互下异构无人集群系统自适应协同控制方法,涉及无人集群系统技术领域。预先建立包括领导者和若干跟随者各自的动力学模型的异构无人集群系统模型,并基于跟随者状态和局部误差设计协同控制方法;针对每一跟随者,在非触发时段,通过开环估计器估计跟随者状态,得到状态估计误差和局部估计误差,在状态估计误差和局部估计误差满足事件触发条件时,触发数据传输;基于跟随者状态、局部跟踪误差、局部估计误差设计自适应律,根据自适应律动态调整控制器的反馈增益和耦合增益。本发明通过事件触发机制实现协同控制和离散通信,并且采用自适应控制方法在线调整反馈和耦合增益,有效应对系统参数的实时变化。

    基于强化学习的异构集群无人系统事件触发协同控制方法

    公开(公告)号:CN116430899A

    公开(公告)日:2023-07-14

    申请号:CN202310453213.9

    申请日:2023-04-25

    Abstract: 本发明公开了基于强化学习的异构集群无人系统事件触发协同控制方法,涉及集群无人系统技术领域,能够减少通信资源的消耗,适用于系统模型未知情况下实现最优协同跟踪控制。具体方案为:建立针对无人系统的系统模型;构建事件触发的分布式观测器,利用观测器来估计领航者的状态;构建基于边的事件触发控制器,重构增广异构无人系统的动力学模型,根据增广异构无人系统动力学模型构建控制器增益矩阵。基于数据驱动的求解机制,首先将无人机系统前期运行的数据存储起来,而后根据无人机系统前期运行数据,利用基于强化学习的策略迭代算法,学习最优的基于边的事件触发控制器,进而保证控制器增益矩阵Ki*最优,实现最优的协同跟踪控制。

    一种强化学习驱动的空地无人集群系统协同编队控制方法

    公开(公告)号:CN120044982A

    公开(公告)日:2025-05-27

    申请号:CN202510169736.X

    申请日:2025-02-17

    Abstract: 本公开提供了一种强化学习驱动的空地无人集群系统协同编队控制方法。建立针对空地无人集群系统的动态模型;构建分布式预定义时间观测器来估计虚拟领导者状态,为协同编队跟踪控制提供的状态参考;重构增广空地无人集群系统的动力学模型,进而构建控制增益矩阵。将分段恒定初始激励应用于增广系统并收集存储其前期运行的状态数据,然后根据空地无人系统前期的运行数据,利用数据驱动方法获得初始稳定控制策略,最后基于离线策略强化学习算法和基于数据的初始稳定控制策略,学习最优编队跟踪控制器,实现空地无人系统的最优编队跟踪控制。本发明能够在系统模型未知情况下,根据复杂任务需求实现空地无人集群系统的最优时变编队跟踪控制。

    一种无人系统在线自适应学习的跟踪控制方法及装置

    公开(公告)号:CN119535967A

    公开(公告)日:2025-02-28

    申请号:CN202411473018.3

    申请日:2024-10-22

    Abstract: 本发明公开了一种无人系统在线自适应学习的跟踪控制方法及装置。本发明可以在无人系统数学模型未知的情况下,仅使用智能无人系统的数据信息学习到一个最优的跟踪控制输入,从而实现最优跟踪控制任务。本发明不需要初始稳定控制策略,数据矩阵列满秩和持续激励的限制条件以及数据存储单元,计算复杂度低且易实施。

Patent Agency Ranking