基于注意力机制和深度强化学习的电网潮流调整方法

    公开(公告)号:CN114970351B

    公开(公告)日:2024-11-05

    申请号:CN202210601241.6

    申请日:2022-05-30

    Applicant: 浙江大学

    Abstract: 基于注意力机制和深度强化学习的电网潮流调整方法。本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。

    基于分布式多智能体强化学习的电网多断面功率控制方法

    公开(公告)号:CN112615379B

    公开(公告)日:2022-05-13

    申请号:CN202011451510.2

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 基于分布式多智能体强化学习的电网多断面功率自动控制方法,通过多智能体与电力仿真环境交互,能够自主学习合适的用于复杂电网的多断面功率控制策略。首先根据电网控制的需要选取N个目标断面,并依此构建强化学习方法的环境、智能体、观测状态、动作、奖励函数等基本元素;其次运行多断面功率控制任务交互环境,创造初始潮流数据集;之后,为每个智能体构造基于深度神经网络的决策网络和估值网络,构建MADDPG(多智能体深度确定性策略梯度)模型并引入分布式方法进行训练自主学习最优控制策略;最后,应用训练完成的策略网络自动断面控制。本发明的优点在于,采用多智能体强化学习方法处理复杂的电网多断面功率控制问题,具有较高的控制成功率且无需专家经验,同时引入分布式方法大幅提升了智能体训练效率。

    基于分布式多智能体强化学习的电网多断面功率自动控制方法

    公开(公告)号:CN112615379A

    公开(公告)日:2021-04-06

    申请号:CN202011451510.2

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 基于分布式多智能体强化学习的电网多断面功率自动控制方法,通过多智能体与电力仿真环境交互,能够自主学习合适的用于复杂电网的多断面功率控制策略。首先根据电网控制的需要选取N个目标断面,并依此构建强化学习方法的环境、智能体、观测状态、动作、奖励函数等基本元素;其次运行多断面功率控制任务交互环境,创造初始潮流数据集;之后,为每个智能体构造基于深度神经网络的决策网络和估值网络,构建MADDPG(多智能体深度确定性策略梯度)模型并引入分布式方法进行训练自主学习最优控制策略;最后,应用训练完成的策略网络自动断面控制。本发明的优点在于,采用多智能体强化学习方法处理复杂的电网多断面功率控制问题,具有较高的控制成功率且无需专家经验,同时引入分布式方法大幅提升了智能体训练效率。

    基于注意力机制和深度强化学习的电网潮流调整方法

    公开(公告)号:CN114970351A

    公开(公告)日:2022-08-30

    申请号:CN202210601241.6

    申请日:2022-05-30

    Applicant: 浙江大学

    Abstract: 基于注意力机制和深度强化学习的电网潮流调整方法。本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。

Patent Agency Ranking