一种基于虚拟遗憾最小化的非零和博弈问题策略求解方法

    公开(公告)号:CN116562375A

    公开(公告)日:2023-08-08

    申请号:CN202310554652.9

    申请日:2023-05-17

    Applicant: 东北大学

    Abstract: 本发明提供一种基于虚拟遗憾最小化的非零和博弈问题策略求解方法,涉及机器博弈技术领域。首先对博弈问题进行建模确定基本博弈信息;然后利用添加对手损失遗憾的虚拟遗憾最小化进行策略迭代,近似求解均衡解;最后计算多次迭代所得的平均策略作为体的决策策略,完成非零和博弈问题求解。本发明用于解决非完美信息下的非零和同步博弈问题,并在典型的游戏求解中验证了有效性。本发明改进应用于非完美信息的虚拟遗憾最小化算法,通过添加对手损失遗憾对智能体进行训练,使得求解质量与原始虚拟遗憾最小化算法相比有了较大的提升,为非零和博弈问题求解提供了一种新思路。

Patent Agency Ranking