Patent search ap:("烟台大学") AND inv:"刘颢" Page 1

1.

发明授权
一种多智能体博弈对抗的异构任务优化方法及系统有权

公开(公告)号：CN119139704B

公开(公告)日：2025-02-28

申请号：CN202411659231.3

申请日：2024-11-20

Applicant: 烟台大学

Inventor： 王莹洁 , 金世龙 , 段培永 , 滕浩钧 , 孙美美 , 刘颢 , 刘志中 , 赵相福

IPC: A63F13/56 , A63F13/837 , G06N3/09

Abstract: 本发明涉及多智能体控制技术领域，尤其是涉及一种多智能体博弈对抗的异构任务优化方法及系统。方法，包括获取博弈双方智能体可观测信息，基于获取的博弈双方智能体可观测信息，利用actor‑critic网络结构生成当前环境下的状态集合，将经验缓存区中的数据顺序打乱并重新编号，并抽取数据结合认知理论对actor‑critic网络结构进行训练。本发明通过先获取博弈双方智能体可观测信息，进而将状态观测数据传递给中心控制器，训练完后智能体就可以不再与中心控制器通信，可以基于自己的局部观测状态通过自己的动作策略函数来产生最优动作。

2.

发明公开
一种多智能体博弈对抗的异构任务优化方法及系统有权

公开(公告)号：CN119139704A

公开(公告)日：2024-12-17

申请号：CN202411659231.3

申请日：2024-11-20

Applicant: 烟台大学

Inventor： 王莹洁 , 金世龙 , 段培永 , 滕浩钧 , 孙美美 , 刘颢 , 刘志中 , 赵相福

IPC: A63F13/56 , A63F13/837 , G06N3/09

Abstract: 本发明涉及多智能体控制技术领域，尤其是涉及一种多智能体博弈对抗的异构任务优化方法及系统。方法，包括获取博弈双方智能体可观测信息，基于获取的博弈双方智能体可观测信息，利用actor‑critic网络结构生成当前环境下的状态集合，将经验缓存区中的数据顺序打乱并重新编号，并抽取数据结合认知理论对actor‑critic网络结构进行训练。本发明通过先获取博弈双方智能体可观测信息，进而将状态观测数据传递给中心控制器，训练完后智能体就可以不再与中心控制器通信，可以基于自己的局部观测状态通过自己的动作策略函数来产生最优动作。

Patent Agency Ranking