基于选择性状态空间与有模型强化学习的机械臂操控方法

    公开(公告)号:CN118721208A

    公开(公告)日:2024-10-01

    申请号:CN202411023330.2

    申请日:2024-07-29

    Abstract: 本发明提供一种基于选择性状态空间与有模型强化学习的机械臂操控方法,首先根据真实环境构建世界模型,世界模型处理第三人称视角下的高维视觉图像,提取图像特征并整合序列状态‑动作信息,机械臂模型再根据世界模型提取的特征信息进行决策与学习,能在较低的交互次数下最大化样本效率,仅利用较少的计算资源就可以让机械臂学习到物品抓取方法,能够提升有模型强化学习算法在不同任务场景中的泛用性,降低训练成本和在实际环境中的部署难度,提升计算效率。

    一种基于深度强化学习的无人机多任务控制方法

    公开(公告)号:CN119002511A

    公开(公告)日:2024-11-22

    申请号:CN202411073367.6

    申请日:2024-08-06

    Abstract: 本发明属于无人机控制技术领域,提供一种基于深度强化学习的无人机多任务控制方法,具体过程为:训练数据生成:构建定点控制任务的任务环境,在该环境中完成定点控制任务的控制器训练;构建避障任务的任务环境,在该环境中完成避障任务控制器训练;利用训练完成的定点控制任务的控制器和避障任务控制器,生成用于多任务智能体离线训练的交互数据;多任务智能体离线训练:利用所述交互数据进行多任务智能体离线训练;多任务智能体在线训练:构建多个单任务环境,将多任务智能体与所述多个单任务环境直接交互,利用所述交互数据进行多任务智能体的在线训练;利用训练好的多任务智能体作为无人机位置控制器,执行无人机多任务控制。

Patent Agency Ranking