一种基于多智能体强化学习的多微网系统协同优化方法

    公开(公告)号:CN114611772B

    公开(公告)日:2024-04-19

    申请号:CN202210178581.2

    申请日:2022-02-24

    Abstract: 本发明公开了一种基于多智能体强化学习的多微网系统协同优化方法,包括如下三个部分:第一部分,建立微网中各设备的数学模型和多微网协同优化宏观模型;第二部分,采用神经网络来拟合多智能体强化学习算法Nash‑Q中的价值函数,解决了维数灾难问题;第三部分,在离线数据集中训练Nash‑Q学习算法直到收敛,训练完成后的智能体用于在线优化,能快速做出合理的决策。本发明可以实现各个微网的利益均衡;对Nash‑Q学习算法的改进解决了维数灾难问题,适用于复杂环境;方法对模型的依赖程度低,在离线环境中训练完成后,算法可根据当前情况快速做出合理的决策,可以较好地满足多微网协同调度的在线决策要求。

    一种基于多智能体强化学习的多微网系统协同优化方法

    公开(公告)号:CN114611772A

    公开(公告)日:2022-06-10

    申请号:CN202210178581.2

    申请日:2022-02-24

    Abstract: 本发明公开了一种基于多智能体强化学习的多微网系统协同优化方法,包括如下三个部分:第一部分,建立微网中各设备的数学模型和多微网协同优化宏观模型;第二部分,采用神经网络来拟合多智能体强化学习算法Nash‑Q中的价值函数,解决了维数灾难问题;第三部分,在离线数据集中训练Nash‑Q学习算法直到收敛,训练完成后的智能体用于在线优化,能快速做出合理的决策。本发明可以实现各个微网的利益均衡;对Nash‑Q学习算法的改进解决了维数灾难问题,适用于复杂环境;方法对模型的依赖程度低,在离线环境中训练完成后,算法可根据当前情况快速做出合理的决策,可以较好地满足多微网协同调度的在线决策要求。

Patent Agency Ranking