-
公开(公告)号:CN113478478A
公开(公告)日:2021-10-08
申请号:CN202110667497.2
申请日:2021-06-16
Applicant: 北京控制工程研究所
Abstract: 本发明公开了一种面向不确定对象的感知执行交互自然柔顺类人操控方法,包括设计应用场景,并通过相机获得工作区域俯视视角Heightmap;设计拨推操控智能体网络;设计操控网络的状态空间输入和动作空间输出;设计操控网络的奖励函数;设计知识引导,包括对拨推操控知识引导、动作空间选取引导、拨推力反馈引导;搭建虚拟仿真场景,设置符合物理世界的动力学参数;搭建仿真学习训练工程,生成拨推操控智能体网络;搭建相应的真实物理场景,并将拨推操控智能体网络进行迁移实验。本发明实现对样本的智能自主拨推归置操控和更高的装箱率。
-
公开(公告)号:CN119625507A
公开(公告)日:2025-03-14
申请号:CN202411706631.5
申请日:2024-11-26
Applicant: 北京控制工程研究所
IPC: G06V20/00 , G06V10/774 , G06V10/82 , G06N3/092
Abstract: 本发明提供了一种月面微小机器人运动的智能决策方法及装置,涉及强化学习技术,其中方法包括:获取月面微小机器人拍摄的当前图像和满足拍摄要求的目标图像;将当前图像和目标图像输入训练好的智能决策模型中,输出得到使机器人移动到拍摄与目标图像最相似的图像的位置的动作决策;其中,智能决策模型是通过训练样本集对预设的动作决策网络训练得到的,训练样本集包括训练目标图像和训练初始图像,训练目标图像是机器人在任意第一位置对待拍摄目标拍摄得到的,训练初始图像是机器人在以第一位置为圆心的圆形区域内任意第二位置拍摄得到的。本方案能够用于计算资源严重受限的星载计算环境中,使月面微小机器人可以自动做出决策。
-
公开(公告)号:CN119625352A
公开(公告)日:2025-03-14
申请号:CN202411706560.9
申请日:2024-11-26
Applicant: 北京控制工程研究所
Abstract: 本发明提供了一种地外天体星表探测图像相似度评价方法,该方法包括:根据用于描述地外天体星表的语义信息,构建语义级预期图像;对语义级预期图像和采集的地外天体星表的拍摄图像分别进行特征提取和分析,得到评价参数;其中,评价参数包括特征点数量、特征相似度、像素误差、余弦相似度和欧式距离;根据评价参数确定语义级预期图像和拍摄图像的相似结果。本方案实现了在探测器上自主评价拍摄图像与语义级抽象描述的预期图像的相似度,提高了相似度评价的可信度与可靠性。
-
公开(公告)号:CN119536282A
公开(公告)日:2025-02-28
申请号:CN202411706514.9
申请日:2024-11-26
Applicant: 北京控制工程研究所
IPC: G05D1/43 , G05D1/243 , G05D109/10
Abstract: 本发明公开了一种非结构环境中月面微小机器人自主移动的训练方法及装置,属于地外探索领域。方法包括:构建用于月面微小机器人自主移动训练的三维仿真场景;根据预设的阈值范围在所述三维仿真场景中对机器人的关键参数进行域随机化处理,并根据处理结果训练生成自主移动智能模型;构建用于月面微小机器人自主移动测试的非结构物理场景;在所述非结构物理环境对所述自主移动智能模型进行测试,并调整关键环境参数,得到自主移动智能模型的测试结果。本发明能够提升自主移动智能模型对关键未知环境的适应性。
-
公开(公告)号:CN115390439B
公开(公告)日:2024-12-13
申请号:CN202210999879.X
申请日:2022-08-19
Applicant: 北京控制工程研究所
IPC: G05B13/02
Abstract: 本发明涉及一种基于残差强化学习的机器人自主化装配方法,步骤包括:根据机器人装配过程中的状态st定义笛卡尔空间控制指令;在机器人末端与装配表面接近阶段设置k1=0;当Fext>Fmax时,机器人与装配表面发生了第一次接触;判断待装配物体是否进入到装配孔位;进入插入阶段,设置k2=0,机器人执行插入操作,当检测到外力Fext>Fd/2时,装配成功。本发明针对装配过程中的接近、搜索、插入三个阶段,分别设计相应的装配策略,使用基于视觉和力觉感知融合的残差强化学习方法和基于解析方法的力控制策略,实现端到端的机器人自学习装配。
-
-
公开(公告)号:CN116305624A
公开(公告)日:2023-06-23
申请号:CN202310118848.3
申请日:2023-02-03
Applicant: 北京控制工程研究所
IPC: G06F30/17 , G06F30/27 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , B25J9/16
Abstract: 一种深度强化学习的轻量抓取网络建模方法,包括:建立机器人物体抓取仿真场景,在仿真场景中构建物体抓取工作空间,并模拟机器人物体抓取试验设备;建立轻量特征提取网络,网络输入为仿真场景中物体抓取空间的RGB‑D图像,网络输出为提取的图像特征向量;将所述图像特征向量输入策略网络,网络输出执行动作的概率分布的均值和方差;根据所述执行动作的概率分布的均值和方差得到执行动作的正态概率分布,在仿真场景中执行相应的动作,得到奖励,仿真环境进入下一环境状态;收集环境状态、执行的动作、奖励及下一状态作为经验,更新特征提取网络和策略网络,直到训练曲线收敛,得到训练好的轻量抓取网络模型。
-
公开(公告)号:CN115470695A
公开(公告)日:2022-12-13
申请号:CN202211001163.2
申请日:2022-08-19
Applicant: 北京控制工程研究所
Abstract: 一种基于偏随机密钥遗传算法的不规则岩石三维装箱优化方法,包括:对岩石样本进行视觉采样和三维重建;对网格模型进行处理;对偏随机密钥遗传算法进行初始化,生成初代种群;建立容器及OBB包围盒的碰撞模型,设置其位置和姿态;建立各OBB包围盒对应的岩石样本的碰撞模型,设置其位置和姿态;添加重力和摩擦力,计算容器空间占有率作为个体的适应度;根据适应度大小将种群个体分为精英个体和一般个体两类,按照偏随机密钥遗传算法对种群进行复制、交叉和变异操作,产生下一代种群;重复执行,当满足终止条件时,输出最大适应度个体解码装箱后各岩石样本的最终位置和姿态作为最终装箱方案。本发明能实现有限容器内对不规则岩石最大化装箱。
-
公开(公告)号:CN115390439A
公开(公告)日:2022-11-25
申请号:CN202210999879.X
申请日:2022-08-19
Applicant: 北京控制工程研究所
IPC: G05B13/02
Abstract: 本发明涉及一种基于残差强化学习的机器人自主化装配方法,步骤包括:根据机器人装配过程中的状态st定义笛卡尔空间控制指令;在机器人末端与装配表面接近阶段设置k1=0;当Fext>Fmax时,机器人与装配表面发生了第一次接触;判断待装配物体是否进入到装配孔位;进入插入阶段,设置k2=0,机器人执行插入操作,当检测到外力Fext>Fd/2时,装配成功。本发明针对装配过程中的接近、搜索、插入三个阶段,分别设计相应的装配策略,使用基于视觉和力觉感知融合的残差强化学习方法和基于解析方法的力控制策略,实现端到端的机器人自学习装配。
-
公开(公告)号:CN115302511A
公开(公告)日:2022-11-08
申请号:CN202211001178.9
申请日:2022-08-19
Applicant: 北京控制工程研究所
IPC: B25J9/16
Abstract: 本发明公开了一种基于图像域的机械臂高效操控归置学习奖励训练方法,实现杂乱场景中机械臂自主归置物体任务。该任务中,由于空间受限、复杂碰撞等约束的存在,导致终止状态是不可预测的,从而对奖励函数的设计带来了困难。本专利对强化学习的奖励是“步骤奖励”和“完成奖励”的组合,通过在图像域中合并来量化终端状态的性能,这将引导终端状态收敛到一个更好的域,而不是特定的值。以鼓励快速排列盒子中分散的对象,同时最小化对象之间的间隙,对不同数量、不规则形状的物体以及间断情况具有更好的适应性。
-
-
-
-
-
-
-
-
-