-
公开(公告)号:CN102621886A
公开(公告)日:2012-08-01
申请号:CN201210033864.4
申请日:2012-02-15
IPC: G05B13/04
Abstract: 本发明涉及一种根据建筑物内区域人数分布对能源设备进行控制的方法,属于建筑节能和消防疏散技术领域。本发明方法中使用人员进出检测装置、人体探测装置和区域控制器。本发明方法一方面利用区域内人体探测装置探测到区域无人时,对区域人数置零,另一方面通过对建筑物区域划分,根据区域功能特点对人员在该区域停留时间进行估计,根据进出检测装置检测人员进出区域时间,与该区域人员停留时间特点进行比较,实现对区域内人数偏差的修正。本方法得到的建筑物内区域人数分布,直接通过控制器对区域内的用电设备和消防疏散设备等进行控制,提高了建筑节能的效果、突发事件发生时的疏散效率,保证建筑物内人员安全。
-
公开(公告)号:CN118889555A
公开(公告)日:2024-11-01
申请号:CN202410908936.8
申请日:2024-07-08
Applicant: 清华大学
Abstract: 本文涉及一种发电机组的控制方法、装置及设备。包括对单一机组的子问题构建状态转移模型,并将拉格朗日乘子对应的各时段惩罚价格作为状态加入模型中。采用强化学习算法,训练每个机组的开关机、功率增减策略;采用代理次梯度方法,对UC问题中耦合不同机组的约束进行松弛,利用代理次梯度方法进行迭代与拉格朗日乘子的更新,其迭代过程中的子问题求解采用训练好的强化学习智能体进行序贯决策,反复迭代直至收敛,得到对偶问题的最优解;将所得的机组组合状态进行可行化操作,对发电机组节点进行控制。本文极大提升代理次梯度方法的计算速度,最终提高发电机组在不同时刻的状态的机组组合问题的计算速度。
-
公开(公告)号:CN118625661A
公开(公告)日:2024-09-10
申请号:CN202410656749.5
申请日:2024-05-24
Applicant: 清华大学 , 中讯邮电咨询设计院有限公司
Abstract: 本说明书涉及数据中心技术领域,提供了一种基于强化学习的数据中心机房的控制方法及装置。所述方法包括:根据数据中心模拟机房中的每一空调单元的状态,及空调单元的临近设备的状态,为每一空调单元建立状态转换模型;将数据中心模拟机房中所有空调单元的状态转移模型,组合构建代理模型;根据代理模型的状态数据及强化学习算法,训练得到一个基础策略;将基础策略部署至各空调单元,分别使用与各空调单元相关的数据对部署至空调单元的基础策略微调,记录每一空调单元的微调策略。本说明书基于代理模型进行高样本效率的强化学习训练,得到单ACU控制的基础策略;引入平衡回放技术对基础策略进行微调,提高强化学习样本效率、控制精度及性能。
-
公开(公告)号:CN112306059B
公开(公告)日:2024-02-27
申请号:CN202011104599.5
申请日:2020-10-15
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种控制模型的训练方法、控制方法以及装置,获取第一采集设备和第一采集设备周围的第一障碍物在设定历史时刻时的状态数据,作为第一状态数据。将第一状态数据输入到控制模型中,确定出第一采集设备在设定历史时刻之后的规划轨迹。根据规划轨迹,确定控制模型对应的奖励函数的奖励值,并根据奖励值,对控制模型进行训练。本方法通过第一采集设备和第一采集设备周围的障碍物在设定历史时刻时的状态数据,进行控制模型的训练,通过训练完成的控制模型规划轨迹,根据规划轨迹对无人驾驶设备进行控制,从而降低了无人驾驶设备与周围障碍物发生碰撞的概率。
-
公开(公告)号:CN117313548A
公开(公告)日:2023-12-29
申请号:CN202311458840.8
申请日:2023-11-03
Applicant: 清华大学
IPC: G06F30/27
Abstract: 本说明书涉及数据中心技术领域,提供了一种基于数字镜像的数据中心运行调试方法及装置。该方法包括:获取目标数据中心的物理场景信息;根据所述物理场景信息确定目标数据中心的元模型;利用元模型的运行状况数据训练所述元模型;根据训练后的元模型和所述物理场景信息建立数据中心镜像模型;根据所述数据中心镜像模型对目标数据中心进行运行调试。通过本说明书实施例,可实现模型精度、模型速度、训练数据成本间的有效平衡。
-
公开(公告)号:CN112599205B
公开(公告)日:2023-07-07
申请号:CN202011582734.7
申请日:2020-12-28
Applicant: 清华大学
Abstract: 本发明公开了一种事件驱动的污水处理过程出水总磷软测量模型设计方法及装置,方法包括:首先,对从污水处理厂获取的原始数据进行预处理,得到待处理任务样本集。然后,利用互信息分析和统计方法对参数变量间的相关性进行度量,选取与出水总磷具有较大相关性的辅助变量。最后,建立基于深度信念网络的出水总磷软测量模型,根据软测量模型训练过程中反映出的数据特性定义事件,并设计事件驱动的软测量模型高效学习策略,进而实现出水总磷的高效、精确检测。本发明利用事件驱动的高效学习策略训练出水总磷软测量模型,提高了样本集的数据效率和总磷检测时效性。
-
公开(公告)号:CN115952737A
公开(公告)日:2023-04-11
申请号:CN202310006010.5
申请日:2023-01-04
Applicant: 清华大学
IPC: G06F30/27 , G06N3/045 , G06N3/092 , G06F119/08 , G06F119/06
Abstract: 本发明公开了一种数据中心运行仿真的优化方法及装置,其中该方法包括:构建数据中心仿真模型;获取数据中心的状态数据集和动作数据集,将状态数据集和动作数据集输入第一状态预测模型,得到第一状态预测模型预测的下一状态数据集;判断下一状态数据集是否满足状态安全判定条件;若满足,将状态数据集和动作数据集输入第二状态预测模型,得到第二状态预测模型预测的下一状态数据集;利用状态数据集、动作数据集和第二状态预测模型预测的下一状态数据集对强化学习算法的网络参数进行优化;利用训练好的强化学习算法确定数据中心的实时状态数据集对应的动作数据集。本发明在数据中心运行仿真时,在确保找出最优控制策略的同时,减少计算资源的消耗。
-
公开(公告)号:CN114330852A
公开(公告)日:2022-04-12
申请号:CN202111573336.3
申请日:2021-12-21
Applicant: 清华大学
Abstract: 本发明公开了一种一体化数据中心柜末端空调系统节能优化方法及装置,该方法包括:确定一体化数据中心柜末端空调系统的马尔可夫决策过程模型;构建一体化数据中心柜仿真环境;在所述仿真环境中,基于马尔可夫决策过程模型,对基于价值的函数逼近型差分强化学习算法进行训练,输出训练好的动作价值函数,在训练过程中通过不断更新时序差分误差、平均收益估计值,实现对动作价值函数的参数的更新;基于训练好的动作价值函数,实时获取当前时刻最大动作价值函数值对应的动作;获得当前时刻最大动作价值函数值对应的动作对应的空调压缩机的开关状态。本发明可以对一体化数据中心柜末端空调系统进行节能优化,效果好,实施难度小。
-
公开(公告)号:CN111027842B
公开(公告)日:2022-04-12
申请号:CN201911229373.5
申请日:2019-12-04
Applicant: 清华大学
Abstract: 本发明公开了一种电动汽车充电与新能源发电的协同调度方法及装置,其中,该方法包括以下步骤:获取当前时段的新能源发电信息和电动汽车的充电功率,确定利用新能源发电进行充电电动汽车数量;获取电动汽车指标因子,对电动汽车指标因子进行排序,获得电动汽车充电优先级序列,并确定当前时段必须充电的电动汽车数量;判断充电电动汽车数量是否不小于必须充电的电动汽车数量,若是,则依据电动汽车充电优先级序列对电动汽车充电,直至新能源发电用尽,若不是,则购买市电为必须充电的电动汽车充电。该方法求解简单,只需计算指标值并排序,即可得出明确的充电策略,且能够直接利用新能源发电信息作为决策信息,更好地实现对新能源发电的利用。
-
公开(公告)号:CN113821903A
公开(公告)日:2021-12-21
申请号:CN202110778803.X
申请日:2021-07-09
Applicant: 腾讯科技(深圳)有限公司 , 清华大学
Abstract: 公开了一种温度控制方法和设备、模块化数据中心以及计算机可读存储介质。该温度控制方法包括:获取受控对象的运行状态,所述运行状态包括受控对象的温度场相关信息和功耗相关信息;将所述运行状态作为输入数据输入到温度控制策略模型,所述温度控制策略模型被配置成基于输入数据生成指示针对受控对象的温度控制动作的输出数据;根据所述温度控制策略模型的输出数据,对受控对象进行温度控制。该温度控制方法利用了机器学习、尤其是强化学习技术实现了受控对象的智能温控。
-
-
-
-
-
-
-
-
-