基于多智能体深度强化学习的生鲜配送车辆路径规划方法

    公开(公告)号:CN118153789A

    公开(公告)日:2024-06-07

    申请号:CN202410324339.0

    申请日:2024-03-21

    Applicant: 东北大学

    Inventor: 刘明昊 黄敏

    Abstract: 本发明公开一种基于多智能体深度强化学习的生鲜配送车辆路径规划方法,涉及强化学习技术领域。首先获取训练数据集和测试数据集,其次构建注意力模型,然后利用训练数据集对注意力模型进行训练,得到训练完成的注意力模型,最后将测试数据集输入到训练完成的注意力模型,得到车辆路径。本发明在求解问题时,充分考虑了不同路径的状态和未服务客户点之间关系,设计了车辆选择解码器和客户点选择解码器,增强了本发明的泛化能力,提升了模型的可解释性;同时在求解过程中使用了多智能体的思想,在求解问题时加快了求解的速度,提升了本发明的整体求解效率和稳定性。

    一种基于虚拟遗憾最小化的非零和博弈问题策略求解方法

    公开(公告)号:CN116562375A

    公开(公告)日:2023-08-08

    申请号:CN202310554652.9

    申请日:2023-05-17

    Applicant: 东北大学

    Abstract: 本发明提供一种基于虚拟遗憾最小化的非零和博弈问题策略求解方法,涉及机器博弈技术领域。首先对博弈问题进行建模确定基本博弈信息;然后利用添加对手损失遗憾的虚拟遗憾最小化进行策略迭代,近似求解均衡解;最后计算多次迭代所得的平均策略作为体的决策策略,完成非零和博弈问题求解。本发明用于解决非完美信息下的非零和同步博弈问题,并在典型的游戏求解中验证了有效性。本发明改进应用于非完美信息的虚拟遗憾最小化算法,通过添加对手损失遗憾对智能体进行训练,使得求解质量与原始虚拟遗憾最小化算法相比有了较大的提升,为非零和博弈问题求解提供了一种新思路。

Patent Agency Ranking