冷源温控和能量优化的智能体离线层次化强化学习方法

    公开(公告)号:CN118642354A

    公开(公告)日:2024-09-13

    申请号:CN202410216374.0

    申请日:2024-02-27

    Abstract: 本发明提供一种冷源温控和能量优化的智能体离线层次化强化学习方法,包括:采集冷源系统以及冷源单元的历史运行数据,进行数据处理生成运行历史数据集;基于冷源系统,通过自动负载工作库目标从无动作的离线强化学习方法学习到状态动作价值函数,基于价值函数提取高层策略进行冷源系统的控制;基于冷源单元,通过概率动力学模型进行学习,引入判别器,将学习过程耦合纳入所述判别器的输入建立合作信息共享,确定低层策略的损失函数,建立低层策略进行冷源单元的控制;将冷源系统的高层策略与冷源单元的低层策略部署至冷却系统,对冷却系统进行在线优化控制。本发明解决了现有冷却系统优化控制数据效率低、分布偏移,高维状态空间难处理的问题。

    白盒与黑盒离散事件系统协同仿真的时序推进方法及装置

    公开(公告)号:CN113806930B

    公开(公告)日:2024-01-30

    申请号:CN202111047135.X

    申请日:2021-09-08

    Applicant: 清华大学

    Abstract: 本公开提出一种白盒与黑盒离散事件系统协同仿真的时序推进方法及装置,属于协同仿真时序一致技术领域。其中,所述方法包括:根据离散事件系统中各白盒子系统的当前步长确定当前安全时间距离和所述各白盒子系统的当前仿真时间;根据所述当前安全时间距离和所述离散事件系统中各黑盒子系统的当前仿真时间,计算所述各黑盒子系统的当前安全仿真时间;根据所述各白盒子系统的当前仿真时间和所述各黑盒子系统的当前安全仿真时间,确定仿真中下一个推进的子系统;按照所述下一个推进的子系统的事件表推进仿真。本公开克服了对黑白盒模型协同仿真中乐观推进策略的不足,引入一种改进的时序推进方法,在尽量规避黑盒模型仿真回滚的情况下实现时序一致性。

    一种复杂产品多分辨率模型跨层次切换控制方法及装置

    公开(公告)号:CN115114768A

    公开(公告)日:2022-09-27

    申请号:CN202210582458.7

    申请日:2022-05-26

    Applicant: 清华大学

    Abstract: 本发明公开了一种复杂产品多分辨率模型跨层次切换控制方法及装置,该方法包括:根据仿真任务,分别确定路面系统模型和车辆系统模型的系统结构状态;其中,路面系统模型包括路面模型,车辆系统模型包括轮胎模型和车体模型;分别构建路面系统模型和车辆系统模型的模型函数,对模型函数进行计算,根据计算结果确定路面模型、轮胎模型和车体模型对应的模型分辨率状态;根据系统结构状态和对应的模型分辨率状态的预设变化状态,进行下次仿真任务。该方法对系统结构状态和模型分辨率状态分别建立描述机制,并提出系统分辨率的控制机制,可满足系统的整体性需求,在保证仿真精度的同时,提升仿真效率,节省所需的仿真资源。

    提高风电消纳能力的方法及装置

    公开(公告)号:CN107069830A

    公开(公告)日:2017-08-18

    申请号:CN201710055630.2

    申请日:2017-01-25

    Abstract: 本发明涉及一种提高风电消纳能力的方法,其中,所述方法包括:获取根据历史数据预先建立的次日风电出力的分布模型;获取风电系统的运行参数,并利用次日风电出力的分布模型建立运行参数的约束条件;获取预先建立的考虑风电系统风险的目标函数,并利用约束条件对目标函数进行约束,得到考虑风电带来的系统风险的火电机组出力日前计划、风电场运行出力日前计划、自备电厂出力调节的日前计划、可平移负荷的日前计划;将获得的优化后的上述日前计划对应发送给火电厂、风电场、参与需求响应的自备电厂和可平移负荷的企业。本发明还涉及一种提高风电消纳能力的装置。该方法和装置能够提高风电消纳能力。

    一种动力学模型支持的有偏好模仿学习方法及系统

    公开(公告)号:CN115099037B

    公开(公告)日:2024-11-29

    申请号:CN202210744890.1

    申请日:2022-06-27

    Applicant: 清华大学

    Inventor: 詹仙园 张文嘉

    Abstract: 本发明提供一种动力学模型支持的有偏好模仿学习方法及系统包括:获取自动驾驶训练所需要的训练样本集,其中,所述训练样本包含离线专家数据集和动力学模型数据集;通过预设的判别器输出加权值训练驾驶模仿策略模型;通过训练后的驾驶模仿策略模型,对自动驾驶车辆进行模仿训练。本发明解决了现有模仿学习可用专家数据有限、训练成本高、效率低的缺陷,以实现快速高效的有偏好模仿学习。

    白盒与黑盒离散事件系统协同仿真的时序推进方法及装置

    公开(公告)号:CN113806930A

    公开(公告)日:2021-12-17

    申请号:CN202111047135.X

    申请日:2021-09-08

    Applicant: 清华大学

    Abstract: 本公开提出一种白盒与黑盒离散事件系统协同仿真的时序推进方法及装置,属于协同仿真时序一致技术领域。其中,所述方法包括:根据离散事件系统中各白盒子系统的当前步长确定当前安全时间距离和所述各白盒子系统的当前仿真时间;根据所述当前安全时间距离和所述离散事件系统中各黑盒子系统的当前仿真时间,计算所述各黑盒子系统的当前安全仿真时间;根据所述各白盒子系统的当前仿真时间和所述各黑盒子系统的当前安全仿真时间,确定仿真中下一个推进的子系统;按照所述下一个推进的子系统的事件表推进仿真。本公开克服了对黑白盒模型协同仿真中乐观推进策略的不足,引入一种改进的时序推进方法,在尽量规避黑盒模型仿真回滚的情况下实现时序一致性。

    一种基于主题消息总线的信息物理异构模型集成装配系统

    公开(公告)号:CN112711859A

    公开(公告)日:2021-04-27

    申请号:CN202110040873.5

    申请日:2021-01-13

    Applicant: 清华大学

    Abstract: 本发明提出一种基于主题消息总线的信息物理异构模型集成装配系统,属于信息物理系统智能控制技术领域。该系统包括:物理设备层,主题消息总线层,智能控制层以及仿真层;其中,所述物理设备层包含若干个工位单元,每个工位单元包括一台上位机和连接该上位机的若干台物理设备;每台物理设备通过所在工位单元的上位机与主题主题消息总线层连接,主题消息总线层、智能控制层和仿真层两两相互连接。该系统通过主题消息总线层将智能制造中信息物理系统的物理设备、工位、虚拟仿真模型,智能控制中心等异构模型的统一互联集成。本发明实时性高,兼容性强,可交互优化装配工艺,操作友好,可以应用于工业领域复杂产品的装配产线及其相关设备。

    一种动力学模型支持的双重有偏好模仿学习方法及系统

    公开(公告)号:CN114986512B

    公开(公告)日:2024-12-31

    申请号:CN202210744893.5

    申请日:2022-06-27

    Abstract: 本发明提供一种动力学模型支持的双重有偏好模仿学习方法及系统,包括:获取自动驾驶训练所需要的训练样本集,其中,所述训练样本包含离线专家数据集、离线无奖励标签数据集和动力学模型数据集;通过预设的第一判别器输出数据与专家数据的接近程度和预设的第二判别器输出数据与真实数据的接近程度构建损失函数,训练驾驶模仿策略模型;通过训练后的驾驶模仿策略模型,对自动驾驶车辆进行模仿训练。本发明解决了现有模仿训练中可用专家数据量少、训练效率低的缺陷,以实现快速高效的有偏好模仿学习。

    基于悬臂结构数字孪生体的灰盒模型构建方法及系统

    公开(公告)号:CN118504168A

    公开(公告)日:2024-08-16

    申请号:CN202410681856.3

    申请日:2024-05-29

    Applicant: 清华大学

    Inventor: 张和明 张文嘉

    Abstract: 本发明提供一种基于悬臂结构数字孪生体的灰盒模型构建方法及系统,包括:获取悬臂结构的关节变量数据;将所述关节变量数据通过灰度变换转换为关节转角三角函数的全排列向量序列;将所述全排列向量序列输入至预设的基于时序序列建立的数据模型;通过对所述数据模型添加多头注意力机制捕捉全排列向量序列中不同的关系和特征,输出悬臂结构的末端位姿,完成灰盒模型构建。本发明解决了现有悬臂结构孪生体仿真模型适应性差、难以兼顾精确度和实时性的问题。

Patent Agency Ranking