部分不可观智能体博弈方法、系统、设备及存储介质

    公开(公告)号:CN117474100A

    公开(公告)日:2024-01-30

    申请号:CN202311450257.2

    申请日:2023-11-02

    Abstract: 本发明公开了一种部分不可观智能体博弈方法、系统、设备及存储介质,相关方法包括:多智能体博弈过程中,每一智能体均各自保存博弈历史序列,并通过如下方式生成决策动作:利用保存博弈历史序列生成所有未知性能的有序效能矢量;从最近的效能评估历史序列中截取历史段,并基于所述所有未知性能的有序效能矢量确定历史段的优先性参考矢量,并生成参考点;从所有未知性能的有序效能矢量中查找当前时刻状态行动对应的次序,并结合参考点生成优先性效能;结合优先性效能通过部分可观马尔可夫决策过程生成决策动作。本发明提供的方案可以通过尝试使用具有更高优先级的行动来提高效果。

Patent Agency Ranking