Patent search ap:("哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)") AND inv:"赵迪" Page 1

1.

发明授权
一种逆变器控制的强化学习训练过程加速方法有权

公开(公告)号：CN118381368B

公开(公告)日：2024-10-29

申请号：CN202410509486.5

申请日：2024-04-23

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 叶剑 , 赵迪

IPC: H02M7/5387 , G06N3/006 , G06N20/00 , H02M7/5395

Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法，包括以下步骤：S1、强化学习控制模型构建；建立逆变器电路仿真模型作为强化学习训练环境，基于强化学习算法构建强化学习控制器模型；S2、强化学习算法设计，基于即时奖励更新强化学习智能体的神经网络参数；S3、即时奖励更新所述强化学习智能体的神经网络参数，直至参数收敛，提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法，在训练过程中提高逆变器的输出电压频率，缩短了训练所需周期数下的训练时间，更快使强化学习智能体学习到最优策略，有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。

2.

发明公开
一种逆变器控制的强化学习训练过程加速方法有权

公开(公告)号：CN118381368A

公开(公告)日：2024-07-23

申请号：CN202410509486.5

申请日：2024-04-23

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 叶剑 , 赵迪

IPC: H02M7/5387 , G06N3/006 , G06N20/00 , H02M7/5395

Abstract: 本发明公开了一种逆变器控制的强化学习训练过程加速方法，包括以下步骤：S1、强化学习控制模型构建；建立逆变器电路仿真模型作为强化学习训练环境，基于强化学习算法构建强化学习控制器模型；S2、强化学习算法设计，基于即时奖励更新强化学习智能体的神经网络参数；S3、即时奖励更新所述强化学习智能体的神经网络参数，直至参数收敛，提取出收敛的强化学习智能体参数应用于实际电路的控制。本发明采用上述的一种逆变器控制的强化学习训练过程加速方法，在训练过程中提高逆变器的输出电压频率，缩短了训练所需周期数下的训练时间，更快使强化学习智能体学习到最优策略，有效解决了针对逆变器控制的强化学习训练过程时间过长的问题。

Patent Agency Ranking