-
公开(公告)号:CN118381368B
公开(公告)日:2024-10-29
申请号:CN202410509486.5
申请日:2024-04-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H02M7/5387 , G06N3/006 , G06N20/00 , H02M7/5395
Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法,包括以下步骤:S1、强化学习控制模型构建;建立逆变器电路仿真模型作为强化学习训练环境,基于强化学习算法构建强化学习控制器模型;S2、强化学习算法设计,基于即时奖励更新强化学习智能体的神经网络参数;S3、即时奖励更新所述强化学习智能体的神经网络参数,直至参数收敛,提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法,在训练过程中提高逆变器的输出电压频率,缩短了训练所需周期数下的训练时间,更快使强化学习智能体学习到最优策略,有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。
-
公开(公告)号:CN118381368A
公开(公告)日:2024-07-23
申请号:CN202410509486.5
申请日:2024-04-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H02M7/5387 , G06N3/006 , G06N20/00 , H02M7/5395
Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法,包括以下步骤:S1、强化学习控制模型构建;建立逆变器电路仿真模型作为强化学习训练环境,基于强化学习算法构建强化学习控制器模型;S2、强化学习算法设计,基于即时奖励更新强化学习智能体的神经网络参数;S3、即时奖励更新所述强化学习智能体的神经网络参数,直至参数收敛,提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法,在训练过程中提高逆变器的输出电压频率,缩短了训练所需周期数下的训练时间,更快使强化学习智能体学习到最优策略,有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。
-