一种基于分层内在激励的多AGV智能调度方法

    公开(公告)号:CN116466662A

    公开(公告)日:2023-07-21

    申请号:CN202310346390.7

    申请日:2023-04-03

    Abstract: 本发明涉及一种基于分层内在激励的多AGV智能调度方法,首先,基于多AGV车间搬运场景,建立部分可观测的马尔科夫决策模型;其次,提出分层内在激励机制,用于实时调整AGV的两种内在激励权重;之后,基于多智能体深度强化学习方法BicNet进行训练,最终将训练好的策略网络部署到每个AGV,进行多AGV智能调度。本发明提出了基于多智能体强化学习的调度方法,各个AGV可以基于策略网络进行自组织地智能调度,提高了多AGV的自主调度能力与任务完成水平,为实现多AGV的自学习、自组织的智能调度提供了解决方案。

    一种基于层次化通信机制的多智能体协作方法

    公开(公告)号:CN116582442A

    公开(公告)日:2023-08-11

    申请号:CN202310285877.9

    申请日:2023-03-22

    Abstract: 本发明公开了一种基于层次化通信机制的多智能体协作方法,首先建立组内通信拓扑结构,根据通信距离将智能体划分为不同组;然后建立组间通信拓扑结构,使用基于邻居节点数量的度中心性方法寻找组中高级别智能体;随后进行组内信息聚合与组间信息交换;使用多头注意力机制搭建层次图卷积网络,对于每个注意头,所有输入特征的值表示都通过关系进行加权并相加;然后,将智能体的m个注意头的输出进行串联,然后将其送入具有ReLU非线性的单层MLP,得到卷积层的输出;最后进行动作决策,根据策略采取行动。本发明通过在智能体之间建立合理高效的层次化通信结构,打破中心化的数据获取、聚合与利用,缓解集中式训练的维度灾难问题。

Patent Agency Ranking