基于深度强化学习的综合能源系统规划优化方法及系统

    公开(公告)号:CN119444502B

    公开(公告)日:2025-05-02

    申请号:CN202510031215.8

    申请日:2025-01-09

    Applicant: 山东大学

    Abstract: 本发明属于综合能源系统规划优化技术领域,为了解决综合能源系统规划中存在的求解困难、耗时长等问题,提出基于深度强化学习的综合能源系统规划优化方法及系统,建立综合能源系统的数学模型,确定综合能源系统的目标函数和约束条件,形成初始动态规划优化问题;将初始动态规划优化问题转化为马尔科夫决策过程;利用DDPG算法和预测网络对综合能源系统的历史运行数据进行离线学习;将离线学习的优化参数应用在Online‑DDPG算法中,对初始动态规划优化问题进行求解,得到综合能源系统的最优规划方案。有效解决了维数灾难和信息损失导致的求解模型问题,同时提高了对负荷与可再生能源波动的抗干扰能力。

    网络攻击下基于强化学习的微电网运行优化方法及系统

    公开(公告)号:CN117808174B

    公开(公告)日:2024-05-28

    申请号:CN202410231339.6

    申请日:2024-03-01

    Applicant: 山东大学

    Abstract: 本发明属于电力系统自动化技术领域,提供了网络攻击下基于强化学习的微电网运行优化方法及系统,其技术方案为:将智能体的奖励函数分解为多个子奖励函数并进行独立优化,使每个子奖励函数都达到帕累托最优,避免出现单一奖励函数的局部最优。将智能体选择的动作是否满足相关指标作为子奖励函数的一部分,若动作满足指标,则反馈给智能体额外的奖励值,从而使智能体倾向于选取满足设定指标的动作。在外界网络攻击存在的情况下,构建蜜罐服务器作为一种安全防护措施,起到保护作用的同时最小化攻击损失,具备一定的现实意义。

    基于深度强化学习的环境友好型微网优化调度方法及系统

    公开(公告)号:CN117726143A

    公开(公告)日:2024-03-19

    申请号:CN202410171476.5

    申请日:2024-02-07

    Applicant: 山东大学

    Abstract: 本发明公开一种基于深度强化学习的环境友好型微网优化调度方法及系统,涉及电力系统优化运行与调度技术领域,该方法包括:搭建包括供需预测模块、碳交易模块、电力交易模块、固碳储能模块、可控分布式电源模块的环境友好型智能微网;获取环境友好型智能微网的运行数据,以收益最大化、成本最小化、供需平衡和碳排放量最小化为综合优化目标,构建环境友好型智能微网优化调度模型;根据深度强化学习理论,采用两层多目标奖励机制和改进的随机高斯策略梯度算法优化微网运行,输出智能微网最优优化调度策略。本发明能够实现对智能微网能源的最优调度,实现微网经济效益、供需平衡和碳排放等多方面的综合优化目标。

    基于分布式牛顿后向分裂的智能电网调度方法及系统

    公开(公告)号:CN116307633A

    公开(公告)日:2023-06-23

    申请号:CN202310537565.2

    申请日:2023-05-15

    Applicant: 山东大学

    Abstract: 本发明公开的基于分布式牛顿后向分裂的智能电网调度方法及系统,属于电网调度技术领域,包括:获取电网能量总需求;根据电网能量总需求及智能电网调度模型,获得机组优化调度结果,其中,智能电网调度模型以电网运行成本最小为目标,以供需平衡约束为约束条件,在通过智能电网调度模型,确定机组优化调度结果时,将智能电网调度模型转换为拉格朗日对偶问题,机组的出力作为拉格朗日对偶问题的对偶变量,基于牛顿后向分裂算法,确定使拉格朗日对偶值最大的拉格朗日乘子,根据确定的拉格朗日乘子,确定使拉格朗日对偶值最小的对偶变量值,该对偶变量值即为机组优化调度结果。提高了智能电网调度的效率。

    一种社交网络数据动态分析方法及系统

    公开(公告)号:CN117539963A

    公开(公告)日:2024-02-09

    申请号:CN202410032828.9

    申请日:2024-01-10

    Applicant: 山东大学

    Abstract: 本发明公开了一种社交网络数据动态分析方法及系统,涉及高性能计算与机器学习技术领域。该方法包括步骤:获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;搭建分布式计算环境;利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。本发明能够克服现有技术在处理大规模社交网络数据时的效率低下和扩展性差的局限性。

    基于多主体联合的新能源系统能源优化调度方法及系统

    公开(公告)号:CN114462727A

    公开(公告)日:2022-05-10

    申请号:CN202210387578.1

    申请日:2022-04-14

    Applicant: 山东大学

    Abstract: 本发明公开一种基于多主体联合的新能源系统能源优化调度方法及系统,涉及能源优化及数据处理方法技术领域,包括:构建多主体能源调度模型,所述多主体能源调度模型包括用户用电模型、分布式能源站供能模型和调度管理系统模型;根据获取的分布式能源站的历史产能数据、调度管理系统的历史时段购电价格系数和历史时段售电价格系数以及用户的新能源用电量占比,对多主体能源调度模型采用逆向归纳法求解后,得到系统整体最优用电量策略。采用三方模型来优化整个能源调度策略,优化整个新能源系统的新能源生产消纳情况,提高新能源利用率,提供用电和供电质量。利用分布式算法,在便于较高计算效率的情况下同时保护个体隐私信息安全。

    机组组合及调度分布式事件触发强化学习优化方法及系统

    公开(公告)号:CN114362258B

    公开(公告)日:2022-05-31

    申请号:CN202210274572.3

    申请日:2022-03-21

    Applicant: 山东大学

    Abstract: 本发明属于智能电网机组的优化组合及调度技术领域,为解决机组资源浪费的问题,提供了机组组合及调度分布式事件触发强化学习优化方法及系统。该方法包括得到机组组合及调度优化模型,在预设约束条件下构建固定动作集合,选出各机组的最优功率即虚拟发电功率;将约束条件转化为投影约束,将虚拟发电功率投影到相应约束范围内,得到符合约束范围内的各机组实际发电功率;基于无带宽约束下各机组实行实际发电功率时的成本,计算相应奖励,根据Q‑学习算法更新Q表中每个机组的局部Q值,得到各机组在无带宽约束下的最优动作;在考虑带宽的约束条件下,得到满足有限带宽约束下的机组组合和调度问题的最优解,提高了机组资源利用率。

    基于多智能体强化学习的供能系统优化方法及系统

    公开(公告)号:CN114372645A

    公开(公告)日:2022-04-19

    申请号:CN202210281045.5

    申请日:2022-03-22

    Applicant: 山东大学

    Abstract: 本发明提供了一种基于多智能体强化学习的供能系统优化方法及系统,属于综合能源系统的设计及其运行优化技术领域,获取多源分布式供能系统的运行参量数据;根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;其中,目标函数中还包括各个智能体之间的收益偏差最小的目标;本发明实现了功能系统各智能体的控制策略优化,极大的提高了多源能源系统的控制能力。

    机组组合及调度分布式事件触发强化学习优化方法及系统

    公开(公告)号:CN114362258A

    公开(公告)日:2022-04-15

    申请号:CN202210274572.3

    申请日:2022-03-21

    Applicant: 山东大学

    Abstract: 本发明属于智能电网机组的优化组合及调度技术领域,为解决机组资源浪费的问题,提供了机组组合及调度分布式事件触发强化学习优化方法及系统。该方法包括得到机组组合及调度优化模型,在预设约束条件下构建固定动作集合,选出各机组的最优功率即虚拟发电功率;将约束条件转化为投影约束,将虚拟发电功率投影到相应约束范围内,得到符合约束范围内的各机组实际发电功率;基于无带宽约束下各机组实行实际发电功率时的成本,计算相应奖励,根据Q‑学习算法更新Q表中每个机组的局部Q值,得到各机组在无带宽约束下的最优动作;在考虑带宽的约束条件下,得到满足有限带宽约束下的机组组合和调度问题的最优解,提高了机组资源利用率。

    一种社交网络数据动态分析方法及系统

    公开(公告)号:CN117539963B

    公开(公告)日:2024-04-05

    申请号:CN202410032828.9

    申请日:2024-01-10

    Applicant: 山东大学

    Abstract: 本发明公开了一种社交网络数据动态分析方法及系统,涉及高性能计算与机器学习技术领域。该方法包括步骤:获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;搭建分布式计算环境;利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。本发明能够克服现有技术在处理大规模社交网络数据时的效率低下和扩展性差的局限性。

Patent Agency Ranking