基于熵优化安全强化学习的特种设备流程控制方法及系统

    公开(公告)号:CN114218867A

    公开(公告)日:2022-03-22

    申请号:CN202111563799.1

    申请日:2021-12-20

    Applicant: 暨南大学

    Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。

    基于熵优化安全强化学习的特种设备流程控制方法及系统

    公开(公告)号:CN114218867B

    公开(公告)日:2022-06-28

    申请号:CN202111563799.1

    申请日:2021-12-20

    Applicant: 暨南大学

    Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。

Patent Agency Ranking