-
公开(公告)号:CN117115608A
公开(公告)日:2023-11-24
申请号:CN202311086572.1
申请日:2023-08-28
Applicant: 北京控制工程研究所
IPC: G06V10/80 , G06V10/774 , G06F16/36
Abstract: 本发明涉及人工智能技术领域,特别涉及一种基于知识嵌入强化学习的决策方法、装置、设备及介质。方法包括:获取目标环境待决策的原始图像;将所述待决策的原始图像输入至预先训练好的强化学习模型,输出与所述待决策的原始图像相对应的决策;所述预先训练好的强化学习模型包括策略网络、评价网络、回报函数和知识融合模块,所述知识融合模块用于将输入的原始图像与先验知识进行融合,以得到包含先验知识的图向量,所述策略网络用于基于所述图向量向所述目标环境输出决策。本发明,可以得到更加符合预期的决策。
-
公开(公告)号:CN111942621B
公开(公告)日:2022-03-04
申请号:CN202010693554.X
申请日:2020-07-17
Applicant: 北京控制工程研究所
Abstract: 一种基于多任务学习的在轨自主加注控制方法及系统,属于空间技术领域。本发明方法包括:构建任务表达网络G和任务执行网络H,在在轨加注虚拟环境中使用强化学习方法训练与微调任务表达网络G和任务执行网络H,直到两个网络的参数收敛,形成多任务策略网络F;在一种基于多任务学习的在轨自主加注控制系统中,将真实机械臂运动状态复位,使用多任务策略网络F对真实机械臂进行控制,使真实机械臂执行相应动作,完成在轨加注操作任务。针对多种操作任务独立学习引起的自主性不足问题,将深度强化学习和多任务学习方法相结合,实现了多种操作任务策略网络的统一表达和学习,相比于人工设计任务状态判断与切换,提升了自主性与鲁棒性。
-
公开(公告)号:CN110398995B
公开(公告)日:2021-04-13
申请号:CN201910631060.6
申请日:2019-07-12
Applicant: 北京控制工程研究所
IPC: G05D19/02
Abstract: 一种压电陶瓷作动器的无模型跟踪控制方法及介质,即基于鲁棒回归预测、PI控制和自适应逆控制相结合的复合跟踪控制方法。将微振动中主要阶次的正余弦函数作为基函数,利用鲁棒回归对参考控制信号进行回归,并利用回归值预测实际控制信号,实现超前控制;内环采用PI控制,实现压电陶瓷对超前控制信号的初步光滑跟踪;通过计算压电陶瓷的响应和参考控制信号的互相关函数,估计响应对参考控制信号的超前量,用以调节控制器中纯滞后环节的延迟拍数,实现压电陶瓷响应与参考控制信号同步;通过计算响应对参考控制信号的线性关系,利用估计系数校正控制器增益和零偏,实现响应对参考控制信号的幅值跟踪;属于随动控制技术领域。
-
公开(公告)号:CN111942621A
公开(公告)日:2020-11-17
申请号:CN202010693554.X
申请日:2020-07-17
Applicant: 北京控制工程研究所
Abstract: 一种基于多任务学习的在轨自主加注控制方法及系统,属于空间技术领域。本发明方法包括:构建任务表达网络G和任务执行网络H,在在轨加注虚拟环境中使用强化学习方法训练与微调任务表达网络G和任务执行网络H,直到两个网络的参数收敛,形成多任务策略网络F;在一种基于多任务学习的在轨自主加注控制系统中,将真实机械臂运动状态复位,使用多任务策略网络F对真实机械臂进行控制,使真实机械臂执行相应动作,完成在轨加注操作任务。针对多种操作任务独立学习引起的自主性不足问题,将深度强化学习和多任务学习方法相结合,实现了多种操作任务策略网络的统一表达和学习,相比于人工设计任务状态判断与切换,提升了自主性与鲁棒性。
-
公开(公告)号:CN108534996B
公开(公告)日:2019-09-06
申请号:CN201810142688.5
申请日:2018-02-11
Applicant: 北京控制工程研究所
IPC: G01M13/00 , G01M13/045
Abstract: 一种基于微振动瀑布图的飞轮刚度参数提取方法,包括如下步骤:(1)建立飞轮转子的径向动力学模型和径向微振动传递模型;(2)对飞轮升速时的微振动进行测试并生成瀑布图;(3)得到飞轮微振动瀑布图上的局部峰值坐标;(4)通过对坐标数据进行分类和鲁棒回归,拟合得到飞轮在全转速范围内的模态及涡动曲线的函数表达式,将四个表达式移项相乘得到构造特征多项式;(5)得到优化的目标函数;(6)通过最优化的方法求解目标函数,得到飞轮径向动力学模型和振动传递模型中的各刚度参数。本发明可应用于设计飞轮时优化配置转子结构刚度,涡动及模态,也可作为飞轮批量生成过程中判定产品结构一致性与合格性的依据。
-
公开(公告)号:CN114781789A
公开(公告)日:2022-07-22
申请号:CN202210233572.9
申请日:2022-03-10
Applicant: 北京控制工程研究所
Abstract: 本发明公开了一种空间精细操作的分层任务规划方法及系统,属于空间技术领域。针对策略网络学习多任务时梯度估计方差大、算法收敛性不佳问题,构建基于动力学估计器和Monte Carlo树搜索的高层策略规划,具体包括如下三个步骤:离线数据采集、异步高/低层策略优化、模型评估。本发明提高算法收敛性,有助于节省在轨服务空间操作的星载计算资源,满足实际工程需求。
-
公开(公告)号:CN110398995A
公开(公告)日:2019-11-01
申请号:CN201910631060.6
申请日:2019-07-12
Applicant: 北京控制工程研究所
IPC: G05D19/02
Abstract: 一种压电陶瓷作动器的无模型跟踪控制方法及介质,即基于鲁棒回归预测、PI控制和自适应逆控制相结合的复合跟踪控制方法。将微振动中主要阶次的正余弦函数作为基函数,利用鲁棒回归对参考控制信号进行回归,并利用回归值预测实际控制信号,实现超前控制;内环采用PI控制,实现压电陶瓷对超前控制信号的初步光滑跟踪;通过计算压电陶瓷的响应和参考控制信号的互相关函数,估计响应对参考控制信号的超前量,用以调节控制器中纯滞后环节的延迟拍数,实现压电陶瓷响应与参考控制信号同步;通过计算响应对参考控制信号的线性关系,利用估计系数校正控制器增益和零偏,实现响应对参考控制信号的幅值跟踪;属于随动控制技术领域。
-
公开(公告)号:CN108278309B
公开(公告)日:2019-09-06
申请号:CN201810057862.6
申请日:2018-01-19
Applicant: 北京控制工程研究所
Abstract: 一种主被动一体化的四足会聚式隔振器,包括上连接板(1)、斜置微振动控制单元(2)、第三开槽碟形弹簧(4)、下连接板(5)、开槽圆柱弹簧(6);开槽圆柱弹簧(6)一端连接第三开槽碟形弹簧(4),另一端固定在下连接板(5)中部;第三开槽碟形弹簧(4)固定在上连接板(1)中部;各斜置微振动控制单元(2)绕开槽圆柱弹簧(6)的中心轴沿上连接板(1)周向均匀分布,倾斜安装,一端与上连接板(1)相连,另一端与下连接板(5)相连。本发明采用主被动一体化结构,能实现宽频段的微振动控制,提高了隔振器的隔振效率和对复杂环境及变化对象的适应性。
-
公开(公告)号:CN108534996A
公开(公告)日:2018-09-14
申请号:CN201810142688.5
申请日:2018-02-11
Applicant: 北京控制工程研究所
IPC: G01M13/00
Abstract: 一种基于微振动瀑布图的飞轮刚度参数提取方法,包括如下步骤:(1)建立飞轮转子的径向动力学模型和径向微振动传递模型;(2)对飞轮升速时的微振动进行测试并生成瀑布图;(3)得到飞轮微振动瀑布图上的局部峰值坐标;(4)通过对坐标数据进行分类和鲁棒回归,拟合得到飞轮在全转速范围内的模态及涡动曲线的函数表达式,将四个表达式移项相乘得到构造特征多项式;(5)得到优化的目标函数;(6)通过最优化的方法求解目标函数,得到飞轮径向动力学模型和振动传递模型中的各刚度参数。本发明可应用于设计飞轮时优化配置转子结构刚度,涡动及模态,也可作为飞轮批量生成过程中判定产品结构一致性与合格性的依据。
-
公开(公告)号:CN117508670A
公开(公告)日:2024-02-06
申请号:CN202311533613.7
申请日:2023-11-16
Applicant: 北京控制工程研究所
Abstract: 本发明涉及人工智能技术领域,特别涉及一种面向复杂任务的空间机器人操作方法及装置。方法包括:获取预先训练好的技能库,所述技能库中包括用于完成目标任务的多个子技能;将所述技能库和所述目标任务输入预先训练好的强化学习模型中,得到在不同时刻需要执行的子技能;其中,在不同时刻下,与所述目标任务相关的环境状态不同,每个子技能分别用于执行所述目标任务中的一个子任务,所述强化学习模型是基于所述技能库和预设任务训练得到的;基于各个子技能指导空间机器人依次完成相应子任务的空间操作,直至完成所述目标任务。本发明,可以使机器人准确地完成复杂的空间任务。
-
-
-
-
-
-
-
-
-