-
公开(公告)号:CN114779661B
公开(公告)日:2023-03-24
申请号:CN202210426787.2
申请日:2022-04-22
Applicant: 北京科技大学
IPC: G05B17/02
Abstract: 本发明公开了一种基于多分类生成对抗模仿学习算法的化学合成机器人系统,包括:基于Mujoco仿真平台搭建的化学合成操作仿真模块,用于模拟真实化学实验环境;多分类生成对抗模仿学习算法框架,用于根据当前实验任务和机器人状态信息,利用多分类生成对抗模仿学习算法生成当前实验任务的期望轨迹;算法优化模块,用于对多分类生成对抗模仿学习算法进行优化。本发明建立了化学实验仿真环境,给强化学习提供更加便捷的训练方式,采用的多分类生成对抗模仿学习算法引入模态的概念,能够更好地学习不同任务的多种专家策略,增强了算法的决策能力,使之更具扩展性和智能性,同时应用多种技巧优化算法的性能,使算法具有更优秀的收敛性能和稳定性。
-
公开(公告)号:CN114779661A
公开(公告)日:2022-07-22
申请号:CN202210426787.2
申请日:2022-04-22
Applicant: 北京科技大学
IPC: G05B17/02
Abstract: 本发明公开了一种基于多分类生成对抗模仿学习算法的化学合成机器人系统,包括:基于Mujoco仿真平台搭建的化学合成操作仿真模块,用于模拟真实化学实验环境;多分类生成对抗模仿学习算法框架,用于根据当前实验任务和机器人状态信息,利用多分类生成对抗模仿学习算法生成当前实验任务的期望轨迹;算法优化模块,用于对多分类生成对抗模仿学习算法进行优化。本发明建立了化学实验仿真环境,给强化学习提供更加便捷的训练方式,采用的多分类生成对抗模仿学习算法引入模态的概念,能够更好地学习不同任务的多种专家策略,增强了算法的决策能力,使之更具扩展性和智能性,同时应用多种技巧优化算法的性能,使算法具有更优秀的收敛性能和稳定性。
-