一种基于任务分解强化学习的多智能体编队协同控制方法

    公开(公告)号:CN119847210A

    公开(公告)日:2025-04-18

    申请号:CN202510024564.7

    申请日:2025-01-07

    Abstract: 本发明涉及信息技术领域,公开了一种基于任务分解强化学习的多智能体编队协同控制方法,该方法旨在解决现有多智能体编队协同控制中任务权重分配效率低下和算法泛化能力弱的问题。方案包括建立多智能体运动模型及避障模型;设计状态、动作空间及回报函数;构建策略网络和基于任务分解的评估函数;设计深度强化学习的策略模型更新方法;设计多任务动态权重更新方法。针对复杂环境,通过多智能体编队协同控制方法,借助任务规划将任务分解为多个并行子任务,降低任务间耦合,从而降低任务间的干扰,并利用动态权重实现不同环境下最优的任务权重分配,提升智能体对不同环境的适应能力。适用于如无人机编队控制、机器人协作等。

    一种基于超图神经网络的多模态轨迹预测方法及装置

    公开(公告)号:CN118569305A

    公开(公告)日:2024-08-30

    申请号:CN202410569102.9

    申请日:2024-05-09

    Abstract: 本发明专利属于多智能体系统和深度学习领域,公开了一种基于超图神经网络的多模态轨迹预测方法及装置,主旨在于解决在多智能体通信中断场景下信息丢失导致算法失效的问题,主要方案利用Gazebo仿真平台构建多智能体集群仿真环境,采集并预处理智能体运动轨迹数据,构建数据集。采用图表示和注意力机制学习成对智能体交互特征,构建交互关系模型,通过神经信息传递机制更新智能体节点信息。设计基于条件变分自动编码器的多模态轨迹预测框架,融合交互关系模型和Transformer网络,实现长期高精度预测。通过模型量化提高实时性,并移植到集群控制算法中。在Gazebo仿真平台模拟通信中断场景测试,有效避免失控或碰撞问题,提升多智能体集群控制性能。

    一种基于多智能体强化学习的可扩展性集群控制方法

    公开(公告)号:CN118393880A

    公开(公告)日:2024-07-26

    申请号:CN202410479873.9

    申请日:2024-04-22

    Abstract: 本发明涉及多智能体系统、人工智能领域,公开了一种基于多智能体强化学习的可扩展性集群控制方法,包括以下步骤:建立多智能体集群运动控制模型;设计智能体的观测状态空间、动作空间、奖励函数;设计智能体Actor网络与基于注意力机制的Critic网络模型;设计算法框架以及网络更新方法;设计集群控制算法的训练流程;本发明利用多智能体深度强化学习技术在复杂环境中实现集群协同控制算法,利用注意力机制提取智能体之间的关键的状态信息,从复杂的全局信息中有选择性的聚焦于局部状态特征提升模型的适应性和泛化能力,使得算法能从小规模的训练中迁移到更大规模的任务,有效的应对更加复杂多变的环境。

    一种基于深度强化学习的花菇种植的智能环境控制方法

    公开(公告)号:CN117694183A

    公开(公告)日:2024-03-15

    申请号:CN202410033177.5

    申请日:2024-01-09

    Abstract: 本发明专利属于深度强化学习和环境控制领域,提供了一种基于深度强化学习的花菇种植的智能环境控制方法。主旨在于解决传统花菇种植方法中缺乏动态环境调节和智能化环境控制的问题,主要方案包括s1.根据花菇生长过程以及生长环境的控制,构建花菇种植生长环境模型;s2.整合现有的花菇种植的专家经验策略和种植数据,构建智能环境控制算法的采样池,并设计算法的采样策略;s3.根据花菇的生长过程特点,设计指导智能控制算法的奖励函数;s4.设计智能环境控制算法的训练流程,使用智能环境控制算法学习环境控制策略,根据输出的环境控制策略改变花菇生长环境。本发明利用深度强化学习实现花菇种植的智能环境控制,进而提升花菇种植产量。

    一种用于耳穴分割的轻量型算法
    7.
    发明公开

    公开(公告)号:CN117036379A

    公开(公告)日:2023-11-10

    申请号:CN202310867691.4

    申请日:2023-07-15

    Abstract: 本发明公开了一种用于耳穴分割的轻量型算法,属于医学图像分割领域,主旨在于通过轻量型算法实现耳穴分割;建立耳穴数据库;基于编码器‑解码器结构建立MobileAPN轻量型深度学习模型,利用CNN网络的位置空间信息学习能力,同时利用transformer捕获全局信息的能力建立像素之间的长程依赖性,基于数据库对模型进行训练,得到最优模型;提出了一种有效的训练策略,即先通过网络进行耳郭区域分割,再在耳郭区域已知的情况下利用耳穴位置的相对固定性进行耳穴分割;最后利用最优模型对测试集图像进行分割;本发明利用MobileAPN轻量型深度学习模型对耳穴进行耳郭类别分割,再利用耳穴位置的相对固定性对耳穴进行分割,其效果上优于该领域的其它轻量分割方法。

    一种基于人群密集度的自适应检测与跟踪方法

    公开(公告)号:CN116935304A

    公开(公告)日:2023-10-24

    申请号:CN202310715444.2

    申请日:2023-06-16

    Abstract: 本发明公开了一种基于人群密集度的自适应检测与跟踪方法,包括以下步骤:监控视频数据预处理及数据集生成;利用行人数据集和头部数据集各自训练目标检测算法;搭建基于深度学习的目标检测与跟踪算法;利用目标位置信息进行距离估计;根据距离估计结果进行人群密集度评估;根据密集度评估结果进行自适应的检测与跟踪方法切换。本发明结合目标检测与目标跟踪算法,采用距离估计方法进行密集度评估以选择合适的检测与跟踪目标,实现自适应检测与跟踪方法,能够适应任意密集度场景,一定程度上解决密集人群遮挡等问题,提升目标检测能力,改善行人检测与跟踪效果。

    一种基于Deep Q-Learning的集群区域覆盖方法

    公开(公告)号:CN114326749B

    公开(公告)日:2023-10-13

    申请号:CN202210026133.0

    申请日:2022-01-11

    Abstract: 本发明公开了一种基于Deep Q‑Learning的集群区域覆盖方法,包括以下步骤:建立集群系统的动力学模型;确定集群中智能体的邻居集合;建立集群系统的运动控制模型;对信息地图进行构造,并对信息地图进行编码;根据信息地图定义强化学习需要的状态空间、行为空间,回报函数;设计Deep Q‑Learning算法所需网络模型;设计自由区域下的Deep Q‑Learning区域覆盖算法;对得到的点按需调整,得到有障碍区域下的Deep Q‑Learning区域覆盖算法。本发明借助Deep Q‑Learning技术实现集群区域覆盖控制算法的训练与学习,实现自由区域和有障碍物区域下的集群区域覆盖,有效提高集群区域覆盖效率,同时能够保证在弱通信环境下算法的稳定性。

Patent Agency Ranking