Patent search ap:("清华大学" OR "北京全路通信信号研究设计院集团有限公司") AND inv:"贾庆山" Page 2

11.

发明公开
多智能体强化学习方法、装置及自动车主体审中-实审

公开(公告)号：CN117521839A

公开(公告)日：2024-02-06

申请号：CN202210891565.8

申请日：2022-07-27

Applicant: 北京三快在线科技有限公司 , 清华大学

Inventor： 李阔 , 贾庆山 , 张涛 , 白钰 , 任冬淳 , 夏华夏

IPC: G06N20/00

Abstract: 本申请公开了一种多智能体强化学习方法、装置及自动车主体，属于人工智能技术领域。方法包括：获取多个全局状态信息，任一个全局状态信息用于表征在任一次更新时多智能体系统的状态；对于任一个全局状态信息，获取任一个全局状态信息在当前次更新时任一智能体的累计差异信息和相邻智能体的累计差异信息，任一智能体的累计差异信息用于表征任一智能体的策略网络在各次更新时更新程度的差异之和；根据多个全局状态信息在当前次更新时任一智能体的累计差异信息和相邻智能体的累计差异信息，对任一智能体的策略网络进行更新。实现了基于分布式的方式更新任一智能体的策略网络，从而实现了多智能体的强化学习。

12.

发明授权
模型训练方法、装置、能效预测方法、装置和存储介质有权

公开(公告)号：CN110866592B

公开(公告)日：2023-12-29

申请号：CN201911032274.8

申请日：2019-10-28

Applicant: 腾讯科技(深圳)有限公司 , 清华大学

Inventor： 夏恒 , 夏俐 , 赵千川 , 贾庆山 , 管晓宏 , 杨震 , 朱华 , 高江 , 岳上 , 韩建军 , 栗权 , 林森 , 赵静洲 , 徐东 , 黄现东 , 郑焕琼

IPC: G06N3/0464 , G06N3/044 , G06N3/084 , G06Q10/04

Abstract: 本发明实施例公开了一种模型训练方法、装置、能效预测方法、装置和存储介质，其中，通过获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据，并构建时序训练集和时序测试集；再构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；最后根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到能耗使用效率预测模型的预测准确度较高，从而更准确的对数据中心的能耗使用效率进行预测。

13.

发明授权
冷源系统的节能控制方法、装置、电子设备和存储介质有权

公开(公告)号：CN113825356B

公开(公告)日：2023-11-28

申请号：CN202110856943.4

申请日：2021-07-28

Applicant: 腾讯科技(深圳)有限公司 , 清华大学

Inventor： 林依挺 , 吴俊杰 , 夏恒 , 贾庆山 , 王宇恒 , 唐静娴 , 陆翔

IPC: H05K7/20 , G06N3/092 , G06N20/20

Abstract: 本申请实施例公开了一种冷源系统的节能控制方法、装置、电子设备和存储介质；本申请实施例可以获取冷源系统的当前状态量和预设控制模型的目标控制策略，根据当前状态量和目标控制策略预测冷源系统在目标时段下多个维度的预测状态量，并将多个维度的预测状态量进行融合，根据预设奖励函数和预设约束条件对融合后预测状态量进行收益计算，再采用预设控制模型，基于收益值确定冷源系统在预设时间段的总收益值，当总收益值不满足预设条件时，根据总收益对目标控制策略进行调整，并将调整后控制策略作为目标控制策略继续预测，当总收益值满足预设条件时，输出训练后控制模型，用以对冷源系统进行控制。该方案可以有效地实现冷源系统的节能控制。

14.

发明授权
一种模型训练方法、能耗使用效率预测方法、装置和介质有权

公开(公告)号：CN110866528B

公开(公告)日：2023-11-28

申请号：CN201911032302.6

申请日：2019-10-28

Applicant: 腾讯科技(深圳)有限公司 , 清华大学

Inventor： 夏恒 , 夏俐 , 赵千川 , 贾庆山 , 管晓宏 , 杨震 , 朱华 , 高江 , 岳上 , 韩建军 , 栗权 , 林森 , 赵静洲 , 徐东 , 黄现东 , 郑焕琼

IPC: G06V10/26 , G06V10/774 , G06V10/764

Abstract: 本发明实施例公开了一种模型训练方法、能耗使用效率预测方法、装置和介质，其中，首先获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；然后根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；再构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；最后根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到的能耗使用效率

15.

发明公开
一种数据中心末端空调系统运行策略确定方法及装置有权

公开(公告)号：CN116880164A

公开(公告)日：2023-10-13

申请号：CN202311149176.9

申请日：2023-09-07

Applicant: 清华大学

Inventor： 牟倪 , 贾庆山 , 胡潇

IPC: G05B13/02 , G06F30/27 , H05K7/20 , G06N3/047 , G06N3/092

Abstract: 本文涉及人工智能领域，提供了一种数据中心末端空调系统运行策略确定方法及装置，方法包括：根据数据中心机房温度场的仿真模型，建立马尔可夫决策过程模型，马尔可夫决策过程模型中状态从空调系统的观测变量中选取，动作从空调系统的控制变量中选取，利用仿真模型提供状态转移函数；建立拟合状态转移过程的神经网络替代模型，神经网络替代模型的输入为t时刻的状态与动作，输出为t+1时刻的状态；将神经网络替代模型作为学习环境，在马尔可夫决策过程模型的基础上，应用强化学习算法，在学习环境中训练得到数据中心末端空调系统运行策略。本文能够提高强化学习的训练效率。

16.

发明授权
化学分子合成仿真方法及装置有权

公开(公告)号：CN113140262B

公开(公告)日：2022-05-03

申请号：CN202110448408.5

申请日：2021-04-25

Applicant: 清华大学

Inventor： 贾庆山 , 刘思威

IPC: G16C20/10

Abstract: 本发明公开了一种化学分子合成仿真方法及装置，该方法包括：针对采样的每个输入组合，判断选择的拼接分子能否与初始形状与引导分子合成的合成形状拼接；能则将拼接后的分子作为新的初始形状；选择拼接分子，并判断选择的拼接分子能否与新的初始形状与引导分子合成的新的合成形状拼接；不能则重新选择拼接分子，并判断能否拼接，直至连续选择的n个拼接分子均不能拼接时，确定合成形状为有限形状或无限形状；在采样得到的输入组合的数量达到采样数量阈值时，计算所有有限形状数量与采样数量阈值的比值，将该比值确定为实际化学反应中有限形状数量与输入组合数量的比值。本发明可以降低实际化学反应带来的时间成本。

17.

发明授权
电池健康评估方法、装置、存储介质及电子设备有权

公开(公告)号：CN110806546B

公开(公告)日：2022-03-08

申请号：CN201911033347.5

申请日：2019-10-28

Applicant: 腾讯科技(深圳)有限公司 , 清华大学

Inventor： 贾庆山 , 唐静娴 , 高江 , 岳上 , 韩建军 , 夏恒 , 朱华 , 栗权 , 林森 , 赵静洲 , 徐东 , 黄现东 , 郑焕琼 , 赵千川 , 夏俐 , 管晓宏

IPC: G01R31/392 , G01R31/367 , G06K9/62

Abstract: 本发明实施例公开了一种电池健康评估方法、装置、存储介质及电子设备。该方案获取待评估电池的多条历史状态数据；从多条历史状态数据中，确定出电池处于浮充状态时的目标历史状态数据；基于目标历史状态数据确定训练样本，并对训练样本进行二叉划分以构建孤立树，由孤立树构成孤立森林模型；获取待评估状态数据，根据待评估状态数据和孤立森林模型计算电池的健康程度，基于此，该方案不仅实现了自动化地对电池进行在线监控和数据处理，而且考虑到UPS电池在使用过程中具有充放电时间占比少、浮充时间占比多的特性，使用电池处于浮充状态下的状态数据构建孤立森林模型来评估电池的健康程度，提高了电池健康程度评估的准确程度。

18.

发明授权
一种模型训练的方法、无人驾驶设备的控制方法及装置有权

公开(公告)号：CN113110526B

公开(公告)日：2021-09-24

申请号：CN202110657875.9

申请日：2021-06-15

Applicant: 北京三快在线科技有限公司 , 清华大学

Inventor： 刘思威 , 贾庆山 , 任冬淳 , 白钰 , 樊明宇 , 夏华夏 , 毛一年

IPC: G05D1/02 , G05B13/02 , G06K9/62 , B60W50/00 , B60W60/00

Abstract: 本说明书公开了一种模型训练的方法、无人驾驶设备的控制方法及装置，并具体公开了，针对每个行驶场景，通过场景行驶模型确定该训练样本所对应的行驶场景并利用该训练样本对该行驶场景对应的决策模型进行训练，得到每个调整后的决策模型，再在调整后的决策模型基础上，确定出每个训练样本对应的实际行驶场景，并利用该实际行驶场景对场景行驶模型进行训练，直至确定满足预设训练条件。而后，在对无人驾驶设备进行控制时，使用训练后的场景行驶模型确定无人驾驶设备所在的行驶场景，再采用与该行驶场景相匹配的决策模型，确定无人驾驶设备对应的控制策略，并控制无人驾驶设备行驶，这样，提高了无人驾驶设备对于不同行驶场景的适应能力。

19.

发明授权
一种多压力级制燃气管网的智能优化方法、系统、终端及存储介质有权

公开(公告)号：CN111553042B

公开(公告)日：2021-09-21

申请号：CN202010326996.0

申请日：2020-04-23

Applicant: 清华大学 , 北京市燃气集团有限责任公司

Inventor： 龙腾 , 刘青 , 贾庆山 , 崔高辰 , 管晓宏 , 赵千川 , 靳晓强

IPC: G06F30/18 , G06F30/20

Abstract: 本申请所提供的一种多压力级制燃气管网的智能优化方法、系统、终端及存储介质，所述方法包括：设定管网初始参数值；利用系统模型求得管网各节点的初始压强、流量、管段压降等参数，并计算得到第一目标函数；固定压力级制层间的进气节点流量，并利用非线性规划的算法优化阀门开度；固定压力级制层间的阀门开度，并利用非线性规划的算法优化进气节点流量，计算得到第二目标函数；判断第一目标函数与第二目标函数的绝对差值是否小于预设精度，若是，则结束，若否，则继续优化直到第一目标函数与第二目标函数的绝对差值小于设定值；本申请采用迭代求解方法，提升跨级调度的及时性和管网仿真优化的准确性。

20.

发明公开
事件驱动的污水处理过程出水总磷软测量模型设计方法有权

公开(公告)号：CN112599205A

公开(公告)日：2021-04-02

申请号：CN202011582734.7

申请日：2020-12-28

Applicant: 清华大学

Inventor： 王功明 , 贾庆山

IPC: G16C20/20 , G16C20/70 , G06N3/08

Abstract: 本发明公开了一种事件驱动的污水处理过程出水总磷软测量模型设计方法及装置，方法包括：首先，对从污水处理厂获取的原始数据进行预处理，得到待处理任务样本集。然后，利用互信息分析和统计方法对参数变量间的相关性进行度量，选取与出水总磷具有较大相关性的辅助变量。最后，建立基于深度信念网络的出水总磷软测量模型，根据软测量模型训练过程中反映出的数据特性定义事件，并设计事件驱动的软测量模型高效学习策略，进而实现出水总磷的高效、精确检测。本发明利用事件驱动的高效学习策略训练出水总磷软测量模型，提高了样本集的数据效率和总磷检测时效性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification