基于帕累托优化和人类反馈强化学习的多目标实时电力调度方法和装置

    公开(公告)号:CN117559453A

    公开(公告)日:2024-02-13

    申请号:CN202311295636.9

    申请日:2023-10-09

    Abstract: 基于帕累托优化和人类反馈强化学习的多目标实时电力调度方法和装置,其方法包括:首先,利用仿真软件构建电力系统初始状态数据集;然后,考虑电力系统实时调度的多目标特点,设计构建多目标奖励框架,并且引入多梯度下降算法求解帕累托优化,利用近端策略优化算法进行强化学习,训练多目标电力调度策略模型;最后,引入人类反馈强化学习框架,将多目标电力调度策略模型与最优潮流计算的人类偏好轨迹数据训练得到的偏好奖励模型融入强化学习框架中,进一步微调多目标电力调度策略模型,实现了综合多个目标和人类偏好的多目标实时电力调度策略模型,可运用微调优化得到的多目标电力调度策略模型进行实时电力调度。

    基于多智能体对比强化学习的电网热稳越限调控方法和系统

    公开(公告)号:CN115603388A

    公开(公告)日:2023-01-13

    申请号:CN202211369486.7

    申请日:2022-11-03

    Abstract: 基于多智能体对比强化学习的电网热稳越限调控方法,首先,根据典型日电网正常运行数据构建一系列电网热稳越限数据集,并利用图注意力神经网络计算电网节点的嵌入表示向量;然后,在基于协作架构的值分解深度Q网络基础上构建发电机调控的多智能体强化学习框架,该框架根据电网图表示特征拟合各发电机节点各动作的价值;然后构建对比学习模型来更好的区分不同发电机节点的特征表示;最后构建发电机动作执行模块,每个发电机根据自己节点的表示向量通过智能体网络选取期望价值最大的动作来调控电网,使得电网从热稳越限恢复到正常状态。本发明还包括基于多智能体对比强化学习的电网热稳越限调控系统。

    基于多粒度树状图神经网络的电力调度与优化方法

    公开(公告)号:CN119518709A

    公开(公告)日:2025-02-25

    申请号:CN202411529530.5

    申请日:2024-10-30

    Applicant: 浙江大学

    Abstract: 基于多粒度树状图神经网络的电力系统调度与优化方法与系统,其方法包括:步骤1.构建电网状态样本数据集;步骤2.对电网数据进行图表示与特征提取;步骤3.构建层次化多粒度电网信息粗化模型;步骤4.构建电网信息图扰动模型;步骤5.构建树状神经网络自适应路径选择模型;步骤6.根据多粒度树状神经网络模型执行电力系统的解释与调度决策。本发明考虑电力系统的图网络结构特性,将电网建模为图数据,并在现有图神经网络模型的基础上,引入多粒度图粗化、可学习扰动以及自适应路径选择模块以构建多层次结构的树状模型,从而分析全局以及不同范围尺度的局部等各个粒度级别的电力系统状态与表征,提升模型的预测准确性和决策的可解释性。

    基于CTGAN的电网暂稳样本可控生成以及评估方法和系统

    公开(公告)号:CN113746087B

    公开(公告)日:2023-03-21

    申请号:CN202110955115.6

    申请日:2021-08-19

    Abstract: 基于CTGAN的电网暂稳样本可控生成以及评估方法,首先,将电网数据处理为表格型数据,以母线、发电机、节点的属性值为特征;然后,使用拼接或相乘的方法将暂态稳定性和负荷水平等多个条件转换为一个独热编码作为控制生成的条件向量,并使用变分高斯混合模型对数据的连续值进行拟合和归一化处理,作为数据生成模型的输入;最后,搭建基于CTGAN的数据生成模型并进行训练,将训练得到的模型应用于电网暂稳样本可控生成任务;提出了从条件控制效果、合成数据与真实数据相似度、合成数据用于训练暂稳评估模型的效果这三个方面对电网数据生成模型进行有效评估的评估框架。本发明还包括基于CTGAN的电网暂稳样本可控生成以及评估系统。

    基于CTGAN的电网暂稳样本可控生成以及评估方法和系统

    公开(公告)号:CN113746087A

    公开(公告)日:2021-12-03

    申请号:CN202110955115.6

    申请日:2021-08-19

    Abstract: 基于CTGAN的电网暂稳样本可控生成以及评估方法,首先,将电网数据处理为表格型数据,以母线、发电机、节点的属性值为特征;然后,使用拼接或相乘的方法将暂态稳定性和负荷水平等多个条件转换为一个独热编码作为控制生成的条件向量,并使用变分高斯混合模型对数据的连续值进行拟合和归一化处理,作为数据生成模型的输入;最后,搭建基于CTGAN的数据生成模型并进行训练,将训练得到的模型应用于电网暂稳样本可控生成任务;提出了从条件控制效果、合成数据与真实数据相似度、合成数据用于训练暂稳评估模型的效果这三个方面对电网数据生成模型进行有效评估的评估框架。本发明还包括基于CTGAN的电网暂稳样本可控生成以及评估系统。

    基于图强化学习的电网多断面越限调控方法和系统

    公开(公告)号:CN115660324A

    公开(公告)日:2023-01-31

    申请号:CN202211227530.0

    申请日:2022-10-09

    Applicant: 浙江大学

    Abstract: 基于图强化学习的电网多断面越限调控方法,首先,基于典型日构建一系列电网多断面越限数据集,并利用图卷积神经网络计算电网节点的嵌入矩阵,利用多层感知机计算断面任务的嵌入表示;根据节点嵌入和任务嵌入生成多断面任务归因图,用以指导智能体对发电机的调度行为;利用加权池化的方法提取电网图表示特征。然后,在基于竞争架构的深度Q网络基础上构建发电机调度强化学习框架,该框架根据电网图表示特征估计各动作的期望奖励值。最后,智能体通过该框架选择最合理的发电机调度动作,实现对电网多断面越限情景的调控。本发明还包括基于图强化学习的电网多断面越限调控系统。

    基于逆强化学习的自动驾驶选道决策方法和系统

    公开(公告)号:CN116890855A

    公开(公告)日:2023-10-17

    申请号:CN202310648155.5

    申请日:2023-06-02

    Applicant: 浙江大学

    Abstract: 基于逆强化学习的自动驾驶选道决策方法和系统,其方法包括:利用规划算法构造专家策略在highway‑env环境中进行仿真得到专家数据集。然后,在强化学习的行动器‑评判器网络架构基础上重构局部奖励函数:在强化学习过程中利用扩展混合评判网络池衡量智能体对于状态的不确定度进而选择课程化子目标;基于子目标重构局部匹配奖励函数引导智能体按照专家轨迹行动。最后利用基于元模仿目标,在强化学习过程中间利用元模仿学习的方法更新局部内在奖励生成器,引导智能体在专家数据附近探索,从奖励函数角度推理建模专家意图,从而进一步引导智能体靠近专家策略。

    基于可解释图神经网络的电网暂态失稳定位方法和系统

    公开(公告)号:CN116502380A

    公开(公告)日:2023-07-28

    申请号:CN202310499262.6

    申请日:2023-05-06

    Abstract: 用于定位暂态失稳子结构的可解释图神经网络方法和系统,包括:首先,将电网数据处理为图结构数据,引入了第一图卷积神经网络作为编码层学习电网中间节点嵌入;然后通过计算图结构的电网数据的节点特征相似度和局部拓扑结构相似度,获得边采样权重;根据边采样权重采样解释子图获取采样掩码矩阵,通过此矩阵控制第二图神经网络运行和分类任务,并在反向传播过程中自定义采样梯度计算方法;最后根据采样掩码矩阵定位电网暂态失稳子结构,根据分类器获得电网数据稳态情况。本发明还包含基于可解释图神经网络的电网暂态失稳定位方法的系统。本发明在使用图神经网络判断电网暂态稳定性的基础上,运用子图可解释技术定位电网暂态失稳子结构。

Patent Agency Ranking