Patent search ap:("吉林建筑大学") AND inv:"刘钢" Page 1

1.

发明公开
一种多Agent深度强化学习算法审中-实审

公开(公告)号：CN113902087A

公开(公告)日：2022-01-07

申请号：CN202111240522.5

申请日：2021-10-25

Applicant: 吉林建筑大学

Inventor： 王旭 , 张宇 , 郭秀娟 , 徐勇 , 尤天舒 , 富倩 , 孙伟 , 刘钢 , 戴传祗 , 吴程巍

IPC: G06N3/00 , G06N3/04 , G06N3/08 , G06N20/00

Abstract: 本发明公开了一种多Agent深度强化学习算法，包括：S1：学习的策略在执行时只使用本地信息，即它们自己的观察结果；S2：智能体之间的通信方法不做任何结构上的假设，即不假设一个可区分的通信渠道；S3：leader层网络只输入全局智能体的状态信息，只作用于每个智能体的输出动作值，并不参与每个智能体的策略执行，既保持每个智能体的独立性，又保证所有智能体群体之间的通信。本发明通过在分布式执行之前加入集中式预判分配权重，增强了智能体群体之间的决策通信，提高了Leader_MADDPG在多变的环境关系中智能体训练过程中的稳定性和训练后的鲁棒性。

Patent Agency Ranking