-
公开(公告)号:CN118011785A
公开(公告)日:2024-05-10
申请号:CN202410157405.X
申请日:2024-02-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种电力电子变换器的强化学习控制器训练环境架构,包括以下步骤:S1、构建强化学习控制器的整体训练环境设计架构;S2、设计强化学习控制器在每个Episode训练的训练时序图以及工况库;S3、从工况库中抽取训练工况到训练时序中时,根据不同工况的优先级设计概率分布;S4、基于提出的强化学习控制器的训练环境架构,对应用于电力电子变换器的强化学习控制器训练直至收敛。本发明采用上述的一种电力电子变换器的强化学习控制器训练环境架构,训练收敛以后的控制器有效提高了变换器运行时面对不同工况的适应性。当实际运行工况改变,如需要增加工况数目时,与训练工况相关的改动只需要在工况库中完成,而无需对训练时序进行调整。