多智能体强化学习方法、装置及自动车主体

    公开(公告)号:CN117521839A

    公开(公告)日:2024-02-06

    申请号:CN202210891565.8

    申请日:2022-07-27

    Abstract: 本申请公开了一种多智能体强化学习方法、装置及自动车主体,属于人工智能技术领域。方法包括:获取多个全局状态信息,任一个全局状态信息用于表征在任一次更新时多智能体系统的状态;对于任一个全局状态信息,获取任一个全局状态信息在当前次更新时任一智能体的累计差异信息和相邻智能体的累计差异信息,任一智能体的累计差异信息用于表征任一智能体的策略网络在各次更新时更新程度的差异之和;根据多个全局状态信息在当前次更新时任一智能体的累计差异信息和相邻智能体的累计差异信息,对任一智能体的策略网络进行更新。实现了基于分布式的方式更新任一智能体的策略网络,从而实现了多智能体的强化学习。

    冷源系统的节能控制方法、装置、电子设备和存储介质

    公开(公告)号:CN113825356B

    公开(公告)日:2023-11-28

    申请号:CN202110856943.4

    申请日:2021-07-28

    Abstract: 本申请实施例公开了一种冷源系统的节能控制方法、装置、电子设备和存储介质;本申请实施例可以获取冷源系统的当前状态量和预设控制模型的目标控制策略,根据当前状态量和目标控制策略预测冷源系统在目标时段下多个维度的预测状态量,并将多个维度的预测状态量进行融合,根据预设奖励函数和预设约束条件对融合后预测状态量进行收益计算,再采用预设控制模型,基于收益值确定冷源系统在预设时间段的总收益值,当总收益值不满足预设条件时,根据总收益对目标控制策略进行调整,并将调整后控制策略作为目标控制策略继续预测,当总收益值满足预设条件时,输出训练后控制模型,用以对冷源系统进行控制。该方案可以有效地实现冷源系统的节能控制。

    一种数据中心末端空调系统运行策略确定方法及装置

    公开(公告)号:CN116880164A

    公开(公告)日:2023-10-13

    申请号:CN202311149176.9

    申请日:2023-09-07

    Applicant: 清华大学

    Inventor: 牟倪 贾庆山 胡潇

    Abstract: 本文涉及人工智能领域,提供了一种数据中心末端空调系统运行策略确定方法及装置,方法包括:根据数据中心机房温度场的仿真模型,建立马尔可夫决策过程模型,马尔可夫决策过程模型中状态从空调系统的观测变量中选取,动作从空调系统的控制变量中选取,利用仿真模型提供状态转移函数;建立拟合状态转移过程的神经网络替代模型,神经网络替代模型的输入为t时刻的状态与动作,输出为t+1时刻的状态;将神经网络替代模型作为学习环境,在马尔可夫决策过程模型的基础上,应用强化学习算法,在学习环境中训练得到数据中心末端空调系统运行策略。本文能够提高强化学习的训练效率。

    化学分子合成仿真方法及装置

    公开(公告)号:CN113140262B

    公开(公告)日:2022-05-03

    申请号:CN202110448408.5

    申请日:2021-04-25

    Applicant: 清华大学

    Inventor: 贾庆山 刘思威

    Abstract: 本发明公开了一种化学分子合成仿真方法及装置,该方法包括:针对采样的每个输入组合,判断选择的拼接分子能否与初始形状与引导分子合成的合成形状拼接;能则将拼接后的分子作为新的初始形状;选择拼接分子,并判断选择的拼接分子能否与新的初始形状与引导分子合成的新的合成形状拼接;不能则重新选择拼接分子,并判断能否拼接,直至连续选择的n个拼接分子均不能拼接时,确定合成形状为有限形状或无限形状;在采样得到的输入组合的数量达到采样数量阈值时,计算所有有限形状数量与采样数量阈值的比值,将该比值确定为实际化学反应中有限形状数量与输入组合数量的比值。本发明可以降低实际化学反应带来的时间成本。

    一种模型训练的方法、无人驾驶设备的控制方法及装置

    公开(公告)号:CN113110526B

    公开(公告)日:2021-09-24

    申请号:CN202110657875.9

    申请日:2021-06-15

    Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置,并具体公开了,针对每个行驶场景,通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练,得到每个调整后的决策模型,再在调整后的决策模型基础上,确定出每个训练样本对应的实际行驶场景,并利用该实际行驶场景对场景行驶模型进行训练,直至确定满足预设训练条件。而后,在对无人驾驶设备进行控制时,使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景,再采用与该行驶场景相匹配的决策模型,确定无人驾驶设备对应的控制策略,并控制无人驾驶设备行驶,这样,提高了无人驾驶设备对于不同行驶场景的适应能力。

    一种多压力级制燃气管网的智能优化方法、系统、终端及存储介质

    公开(公告)号:CN111553042B

    公开(公告)日:2021-09-21

    申请号:CN202010326996.0

    申请日:2020-04-23

    Abstract: 本申请所提供的一种多压力级制燃气管网的智能优化方法、系统、终端及存储介质,所述方法包括:设定管网初始参数值;利用系统模型求得管网各节点的初始压强、流量、管段压降等参数,并计算得到第一目标函数;固定压力级制层间的进气节点流量,并利用非线性规划的算法优化阀门开度;固定压力级制层间的阀门开度,并利用非线性规划的算法优化进气节点流量,计算得到第二目标函数;判断第一目标函数与第二目标函数的绝对差值是否小于预设精度,若是,则结束,若否,则继续优化直到第一目标函数与第二目标函数的绝对差值小于设定值;本申请采用迭代求解方法,提升跨级调度的及时性和管网仿真优化的准确性。

    事件驱动的污水处理过程出水总磷软测量模型设计方法

    公开(公告)号:CN112599205A

    公开(公告)日:2021-04-02

    申请号:CN202011582734.7

    申请日:2020-12-28

    Applicant: 清华大学

    Inventor: 王功明 贾庆山

    Abstract: 本发明公开了一种事件驱动的污水处理过程出水总磷软测量模型设计方法及装置,方法包括:首先,对从污水处理厂获取的原始数据进行预处理,得到待处理任务样本集。然后,利用互信息分析和统计方法对参数变量间的相关性进行度量,选取与出水总磷具有较大相关性的辅助变量。最后,建立基于深度信念网络的出水总磷软测量模型,根据软测量模型训练过程中反映出的数据特性定义事件,并设计事件驱动的软测量模型高效学习策略,进而实现出水总磷的高效、精确检测。本发明利用事件驱动的高效学习策略训练出水总磷软测量模型,提高了样本集的数据效率和总磷检测时效性。

Patent Agency Ranking