-
公开(公告)号:CN119139704B
公开(公告)日:2025-02-28
申请号:CN202411659231.3
申请日:2024-11-20
Applicant: 烟台大学
IPC: A63F13/56 , A63F13/837 , G06N3/09
Abstract: 本发明涉及多智能体控制技术领域,尤其是涉及一种多智能体博弈对抗的异构任务优化方法及系统。方法,包括获取博弈双方智能体可观测信息,基于获取的博弈双方智能体可观测信息,利用actor‑critic网络结构生成当前环境下的状态集合,将经验缓存区中的数据顺序打乱并重新编号,并抽取数据结合认知理论对actor‑critic网络结构进行训练。本发明通过先获取博弈双方智能体可观测信息,进而将状态观测数据传递给中心控制器,训练完后智能体就可以不再与中心控制器通信,可以基于自己的局部观测状态通过自己的动作策略函数来产生最优动作。
-
公开(公告)号:CN119139704A
公开(公告)日:2024-12-17
申请号:CN202411659231.3
申请日:2024-11-20
Applicant: 烟台大学
IPC: A63F13/56 , A63F13/837 , G06N3/09
Abstract: 本发明涉及多智能体控制技术领域,尤其是涉及一种多智能体博弈对抗的异构任务优化方法及系统。方法,包括获取博弈双方智能体可观测信息,基于获取的博弈双方智能体可观测信息,利用actor‑critic网络结构生成当前环境下的状态集合,将经验缓存区中的数据顺序打乱并重新编号,并抽取数据结合认知理论对actor‑critic网络结构进行训练。本发明通过先获取博弈双方智能体可观测信息,进而将状态观测数据传递给中心控制器,训练完后智能体就可以不再与中心控制器通信,可以基于自己的局部观测状态通过自己的动作策略函数来产生最优动作。
-