一种基于强化学习的城市垃圾收运方法及系统

    公开(公告)号:CN119026779A

    公开(公告)日:2024-11-26

    申请号:CN202411255382.2

    申请日:2024-09-09

    Abstract: 本发明公开了一种基于强化学习的城市垃圾收运方法及系统,该方法包括:基于马尔可夫决策过程,构建垃圾收运车与收发点的行驶模型;基于所述行驶模型,根据优化目标,定义第一状态空间、第一动作空间和第一奖励函数;基于马尔可夫决策过程,构建路径模型;基于所述路径模型,限定搜索空间,划分第二状态空间、第二动作空间和第二奖励函数;基于所述行驶模型和所述路径模型,对垃圾收运网络进行优化,调整行驶方案与收运点布置。该系统包括:第一深度学习模块、第二深度学习模块和优化模块。通过使用本发明,利用了Q学习算法,能够提高城市垃圾收运效率。本发明可广泛应用于智慧城市领域。

    基于强化学习的邻避事件应对策略生成方法、装置及介质

    公开(公告)号:CN119204666A

    公开(公告)日:2024-12-27

    申请号:CN202411232222.6

    申请日:2024-09-04

    Abstract: 本发明公开了一种基于强化学习的邻避事件应对策略生成方法、装置及介质,该方法包括:根据邻避事件的场景,设定参数并构建强化学习模型;获取初始状态,采用Q‑Learning算法对所述强化学习模型进行强化学习,以奖励最大为目标,迭代确定最优策略。该装置包括:设置模块和仿真模块。该介质包括存储有上述基于强化学习的邻避事件应对策略生成方法的计算机程序。通过使用本发明,解决了传统的风险危机分析方法缺少普适性和动态不确定性的问题,输出最优行为策略能够有效化解邻避事件引起的不稳定风险。本发明可广泛应用于策略自生成领域。

    一种基于贝叶斯网络的城市电力安全稳定风险评估方法

    公开(公告)号:CN119026917A

    公开(公告)日:2024-11-26

    申请号:CN202411254829.4

    申请日:2024-09-09

    Abstract: 本发明提供一种基于贝叶斯网络的城市电力安全稳定风险评估方法,包括对原始案例及其情景进行风险因素识别,形成城市电力安全稳定风险因素集;采用K‑means聚类算法分析筛选风险指标,构建城市电力安全稳定风险评估指标体系;通过AHP‑熵权法确定城市电力安全稳定风险评估指标体系各级指标权重并对其进行修正,根据指标隶属关系构建加权贝叶斯网络评估模型;进行加权贝叶斯网络模型参数学习,通过训练好的加权贝叶斯网络评估模型预测城市电力安全稳定风险的概率值。本发明采用改进后的加权贝叶斯网络进行风险评估,改善了贝叶斯网络条件独立性假设的前提,增强贝叶斯网络对风险评估适用性,提高了推理结果的准确性。

Patent Agency Ranking