基于强化学习的无人机协同控制最优进化策略的求解方法

    公开(公告)号:CN117289714A

    公开(公告)日:2023-12-26

    申请号:CN202310991229.5

    申请日:2023-08-08

    Abstract: 本发明公开了基于强化学习的无人机协同控制最优进化策略的求解方法,属于控制理论技术领域,包括以下步骤:定义每个体的策略动态;推导出个体i的局部邻域误差动态;定义无人机i的性能函数;根据性能函数定义价值函数;得到哈密顿方程;价值函数迭代;得出HJB方程的估计式;得到行为网络理想权值的更新算法;得到评价网络理想权值的更新策略;使用上述评价网络迭代更新策略进而得到最优解。通过上述方式,本发明具有不同选择强度的自适应策略更新框架,使个体以最小的策略变化达到最优状态和更高的协作水平以解决博弈问题;本发明利用耦合HJB方程求解策略变化最小的最优策略更新规则,同时求解HJB方程,证明了本文方法的稳定性和收敛性。

    一种基于强化学习算法的通信拓扑优化方法

    公开(公告)号:CN116938732A

    公开(公告)日:2023-10-24

    申请号:CN202310991392.1

    申请日:2023-08-08

    Abstract: 本发明公开了一种基于强化学习算法的通信拓扑优化方法,属于多智能体系统技术领域,包括以下步骤:S101、构建基于强化学习算法的最优通信拓扑生成框架;S102、设计基于通信距离和收敛时间的通讯拓扑评价函数,利用评价函数的值作为学习最优策略更新规则的奖励值;S103、改变通信拓扑,根据多智能体系统的运行结果选择出最优的通信拓扑结构,保证多智能体系统稳定并提高系统控制器的性能。通过上述方式,本发明融合强化学习算法DQN生成最优通信拓扑,充分考虑了多智能体系统的控制器性能和通信成本,在保证系统的稳定性前提下,大幅提高了系统控制器的性能,减少了系统收敛的时间,有效降低了智能体之间的通信成本。

    基于信号遗失环境下连续系统动态迭代问题处理方法

    公开(公告)号:CN116720347A

    公开(公告)日:2023-09-08

    申请号:CN202310650450.4

    申请日:2023-06-02

    Abstract: 本发明提出基于信号遗失环境下连续系统动态迭代问题处理方法,包括以收益矩阵为基准、再对二元的进化动态模型进行研究、引入策略演化规律、构建的演化动力学模型、再引入囚徒困境以及雪堆困境演化动力学模型、对获得的演化动力学模型进行收敛性分析以及对信号遗失网络中的演化动力学模型进行收敛性研究七个步骤,本发明基于李雅普诺夫函数进行研究,而非传统的雅可比矩阵,使得建立的演化动力学模型具有速度快、精确度高、能够处理信号遗失环境下的计算的优点,本发明相较于传统的演化动力学模型,能够更快速更准确的处理分析数据,能够满足在信号遗失环境下的运算需求,适用于元素更多,更复杂的环境。

    一种基于二阶通讯拓扑的大型集群控制方法

    公开(公告)号:CN114115002B

    公开(公告)日:2023-08-11

    申请号:CN202111335259.8

    申请日:2021-11-11

    Abstract: 本发明公开了人工智能技术领域的一种基于二阶通讯拓扑的大型集群控制方法包括至少两个具备自主运行能力的智能主体形成第一阶通讯拓补,第一阶通讯拓补中的智能主体包括跟随者和唯一领导者,任意智能主体都带有若干子群体,子群体形成第二阶通讯拓补,第二阶通讯拓补的领导者为第一阶通讯拓补的其中一个跟随者。针对大型集群系统控制中,传统方法造成的参数强耦合缺点,设定第一阶通讯拓扑中的跟随者为第二阶通讯拓扑中的领导者,减小不同通讯拓扑之间的联系,使不同通讯拓扑下子群系统独立运作,解决传统方法造成的参数强耦合缺点。

    一种基于状态预测的人工势能场无人机集群控制方法

    公开(公告)号:CN114167896B

    公开(公告)日:2023-06-23

    申请号:CN202111495809.2

    申请日:2021-12-09

    Abstract: 本发明公开了一种基于状态预测的人工势能场无人机集群控制方法,首先获取无人机集群的初始状态信息;再计算集群中每架无人机在时刻t的预测状态;然后计算每架无人机的规避碰撞控制输入和队形保持控制输入;最后计算集群中每架无人机的控制输入,并根据控制输入进行集群状态更新。本发明使用状态预测建模改进后的人工势场方法能够为无人机预留更多空间缓冲,及时响应队形的变化,降低实际情况中延迟对无人机集群的影响,以及其他不确定因素对集群完成预设目标的影响。

    一种农药喷洒用无人机
    6.
    发明公开

    公开(公告)号:CN112918680A

    公开(公告)日:2021-06-08

    申请号:CN202110220897.9

    申请日:2021-02-26

    Abstract: 本发明公开了一种农药喷洒用无人机,包括固定板和放置箱,还包括能够对药箱进行夹持防止晃动的夹持结构、能够对连杆进行防护的防护结构和将药液进行过滤防止堵塞导管的拆卸结构,所述固定板顶端的一侧均安装有风机,且风机之间的一侧安装有放置箱,所述固定板底端的一侧安装有支撑杆,且支撑杆的底端安装有固定块,所述固定块之间的一端设置有连接杆,且连接杆的底端安装有固定底座,所述防护结构安装于连接杆的外侧,所述放置箱底端的中间位置处均安装有喷淋管。本发明通过安装有连接板和防护层,通过转动紧固螺栓,使固定弹簧受力并缩短长度,使紧固螺栓脱离连接板,从而对防护层进行拆卸更换,增加无人机使用的寿命。

    一种基于动态权重调整的社交网络平衡优化方法及系统

    公开(公告)号:CN119514800A

    公开(公告)日:2025-02-25

    申请号:CN202411689764.6

    申请日:2024-11-25

    Abstract: 本发明公开了一种基于动态权重调整的社交网络平衡优化方法及系统,属于社交网络分析和优化领域,包括以下步骤:S1、构建有向图的社会网络模型,划分关键边与非关键边;S2、引入虚拟领导者‑跟随者结构以提高个体与集体的合作收益;S3、构建汉密尔顿‑雅各比‑贝尔曼(HJB)耦合方程,应用最优控制策略动态调整关键边权重;S4、实施权重调整机制调整非关键边权重并确保网络强平衡状态。通过上述方式,设计了一种基于动态权重调整的社交网络平衡优化方法,充分考虑了社会网络中个体与集体的互动,确保了网络合作的全局优化。本发明引入了一种全新的权重调整机制,在克服局部最优陷阱的前提下,显著提升了网络的整体合作效率和稳定性。

    基于自适应神经网络的分布式平均跟踪控制方法和系统

    公开(公告)号:CN119511725A

    公开(公告)日:2025-02-25

    申请号:CN202411648865.9

    申请日:2024-11-19

    Abstract: 本发明公开了一种基于自适应神经网络的分布式平均跟踪控制方法和系统,包括:首先,构造异构非线性多智能体系统的网络结构拓扑图,其中每个节点代表一个智能体,并获取图的点集、边集及每个节点的邻居信息;其次,基于系统的状态方程,为每个节点设置参考信号;接着,设计基于自适应神经网络的分布式平均跟踪方法;最后,设计自适应参数,以实现对多个时变信号的分布式平均跟踪。通过结合径向基函数神经网络与内模驱动的外部干扰观测器,本发明在系统不确定性和外部干扰情况下,成功实现多个时变参考信号的平均跟踪。因此,本发明在多机器人协同等领域具有重要的理论和实践价值。

    一种基于大模型的无人集群编队控制算法智能生成方法

    公开(公告)号:CN117647934B

    公开(公告)日:2024-04-23

    申请号:CN202410121313.6

    申请日:2024-01-29

    Abstract: 本发明属于临地安防技术体系中的群体智能技术领域,公开了一种基于大模型的无人集群编队控制算法智能生成方法,该方法通过将大语言模型与数学模型库和专家知识库相结合,能够根据用户的设计开发需求,自动完成控制算法的生成、仿真环境的构建和控制算法的调参。在该方法中,大语言模型主要用于理解用户的设计开发需求,并将需求分解成子任务:控制算法生成、仿真环境生成和控制算法调参。在执行子任务时,大语言模型会按任务需求访问数学模型库和专家知识库,以获取相关的先验知识,并调用Matlab软件以求解复杂导函数和方程,同时调用AirSim软件来构建仿真环境和进行控制算法调参的工作。

Patent Agency Ranking