-
公开(公告)号:CN115453880B
公开(公告)日:2025-02-07
申请号:CN202211156355.0
申请日:2022-09-21
Applicant: 中国科学院计算技术研究所
IPC: G05B13/04 , G06N3/092 , G06N3/0475
Abstract: 本发明提供一种基于对抗神经网络的用于状态预测的生成模型的训练方法,所述对抗神经网络包括生成模型和判别器,所述生成模型和判别器均包括多层全连接网络,所述方法包括:S1、从目标系统的约束条件下的所有可行的可能控制动作中,采样多条预测时域长度的控制动作序列,并将每条控制动作序列送入目标系统的真实环境中进行执行获得每条控制动作序列对应的目标系统的目标状态序列,将每条控制动作序列送入生成模型获得每条控制动作序列对应的目标系统未来状态预测序列;S2、以目标系统当前的状态、每条控制动作序列、每条控制动作序列被执行后对应的目标系统的目标状态序列组成样本,生成训练集;S3、采用训练集对生成对抗网络进行多次训练至收敛。
-
公开(公告)号:CN115453880A
公开(公告)日:2022-12-09
申请号:CN202211156355.0
申请日:2022-09-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于对抗神经网络的用于状态预测的生成模型的训练方法,所述对抗神经网络包括生成模型和判别器,所述生成模型和判别器均包括多层全连接网络,所述方法包括:S1、从目标系统的约束条件下的所有可行的可能控制动作中,采样多条预测时域长度的控制动作序列,并将每条控制动作序列送入目标系统的真实环境中进行执行获得每条控制动作序列对应的目标系统的目标状态序列,将每条控制动作序列送入生成模型获得每条控制动作序列对应的目标系统未来状态预测序列;S2、以目标系统当前的状态、每条控制动作序列、每条控制动作序列被执行后对应的目标系统的目标状态序列组成样本,生成训练集;S3、采用训练集对生成对抗网络进行多次训练至收敛。
-
公开(公告)号:CN119148711A
公开(公告)日:2024-12-17
申请号:CN202411290060.1
申请日:2024-09-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种混合地形轨迹规划系统,用于在混合地形环境下为行进目标规划行进路径,所述系统包括:感知处理模块,其配置有预训练语义分割网络和编码器;其中,所述预训练语义分割网络用于对行进目标采集的多个时刻连续的RGB地形图像进行语义特征提取以得到每个时刻的多标签地形特征图;所述编码器用于对每个时刻的多标签地形特征图进行编码处理以得到每个时刻的混合地形语义特征图;轨迹规划模块,用于基于其上配置的策略网络对行进目标采集的多个时刻连续的行进目标的行进状态、地形深度图以及感知处理模块传递的与之对应的多个时刻连续的混合地形语义特征图进行处理以获取目标规划轨迹。
-
公开(公告)号:CN117419720A
公开(公告)日:2024-01-19
申请号:CN202311229497.X
申请日:2023-09-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于分层强化学习进行同步定位与建图的方法,包括:获取分层强化学习模型,其包括定位模块、地图重建模块、全局策略模块、规划器和局部策略模块;持续获取成对观测图,并由所述分层强化学习模型基于强化学习确定控制所述机器人在所处环境运动的控制动作、定位结果和更新所处环境对应的地图,其中,执行当前的控制动作后收集训练数据用于全局策略模块的强化学习,每条训练数据包括一个控制动作对应的全局奖励,所述全局奖励与探索效率和地图精度正相关并在该控制动作导致产生回环信号后对探索效率进行额外奖励。
-
-
-