一种基于强化学习的城市垃圾收运方法及系统

    公开(公告)号:CN119026779A

    公开(公告)日:2024-11-26

    申请号:CN202411255382.2

    申请日:2024-09-09

    Abstract: 本发明公开了一种基于强化学习的城市垃圾收运方法及系统,该方法包括:基于马尔可夫决策过程,构建垃圾收运车与收发点的行驶模型;基于所述行驶模型,根据优化目标,定义第一状态空间、第一动作空间和第一奖励函数;基于马尔可夫决策过程,构建路径模型;基于所述路径模型,限定搜索空间,划分第二状态空间、第二动作空间和第二奖励函数;基于所述行驶模型和所述路径模型,对垃圾收运网络进行优化,调整行驶方案与收运点布置。该系统包括:第一深度学习模块、第二深度学习模块和优化模块。通过使用本发明,利用了Q学习算法,能够提高城市垃圾收运效率。本发明可广泛应用于智慧城市领域。

Patent Agency Ranking