-
公开(公告)号:CN117115608A
公开(公告)日:2023-11-24
申请号:CN202311086572.1
申请日:2023-08-28
Applicant: 北京控制工程研究所
IPC: G06V10/80 , G06V10/774 , G06F16/36
Abstract: 本发明涉及人工智能技术领域,特别涉及一种基于知识嵌入强化学习的决策方法、装置、设备及介质。方法包括:获取目标环境待决策的原始图像;将所述待决策的原始图像输入至预先训练好的强化学习模型,输出与所述待决策的原始图像相对应的决策;所述预先训练好的强化学习模型包括策略网络、评价网络、回报函数和知识融合模块,所述知识融合模块用于将输入的原始图像与先验知识进行融合,以得到包含先验知识的图向量,所述策略网络用于基于所述图向量向所述目标环境输出决策。本发明,可以得到更加符合预期的决策。
-
公开(公告)号:CN104573193A
公开(公告)日:2015-04-29
申请号:CN201410790930.1
申请日:2014-12-18
Applicant: 北京控制工程研究所
IPC: G06F17/50
Abstract: 一种航天器GNC系统快速设计方法,步骤为:(1)将航天器GNC系统划分为动态模型和事件驱动模型,并分别采用Simulink模型库和Stateflow的有限状态机进行建模;(2)将安装有VxWorks操作系统的工控机作为运行GNC系统的硬件系统,把相关VxWorks驱动程序编写成Simulink的库文件;(3)在Simulink编辑环境中,根据信息流向和数据依存关系,把各模型和库文件进行连接,形成完整GNC系统的mdl文件;(4)将mdl文件转换为目标代码,对目标代码进行编译并链接辅助文件后生成可执行目标程序;(5)通过网络将可执行目标程序下载至工控机上,在工控机上运行可执行目标程序,由此得到一个GNC系统原型。
-
公开(公告)号:CN117315546A
公开(公告)日:2023-12-29
申请号:CN202311345148.4
申请日:2023-10-17
Applicant: 北京控制工程研究所
IPC: G06V20/40 , G06V10/774 , G06V10/82
Abstract: 本发明提供了一种面向空间操作的无监督事件抽取方法及装置,其中方法包括:对样本视频序列中多帧图像一一对应的生成语义关系图,由于语义关系图中包括相应图像中多个物体形成的拓扑结构,因此针对样本视频序列对应的语义关系图序列可以确定出拓扑结构变化状态,而事件的发生可以看作是拓扑结构的变化,通过将多个拓扑结构变化状态进行聚类,那么同一类中的拓扑结构变化状态可以看作是发生了相同的事件,因此,利用聚类能够无监督的得到多个训练样本对,利用该多个训练样本对可以实现对事件抽取网络的训练,进而本方案可以利用训练好的事件抽取网络实现从视频序列中进行无监督事件的抽取。
-
公开(公告)号:CN117493884A
公开(公告)日:2024-02-02
申请号:CN202311533174.X
申请日:2023-11-16
Applicant: 北京控制工程研究所
IPC: G06F18/214 , G06F18/2415 , G06N3/092
Abstract: 本发明涉及人工智能技术领域,特别涉及一种面向复杂场景的强化学习决策方法及装置。获取目标环境的当前状态和与该当前状态对应的事件状态集,所述事件状态集是预先训练好的事件生成网络模型基于该当前状态确定的;所述事件生成网络模型是基于包含多个样本对的样本集训练得到的,每个所述样本对均包括目标环境的环境状态和与该环境状态相对应的事件集中各事件发生的概率;将所述当前状态和所述事件状态集输入至预先训练好的强化学习网络模型,输出与该当前状态相对应的决策,所述强化学习网络模型是以所述目标环境的环境状态和所述事件生成网络模型输出的事件状态集为输入训练得到的。本发明方法,可以对复杂场景做出准确的决策。
-
公开(公告)号:CN117047763A
公开(公告)日:2023-11-14
申请号:CN202311086605.2
申请日:2023-08-28
Applicant: 北京控制工程研究所
IPC: B25J9/16
Abstract: 本发明涉及人工智能技术领域,特别涉及一种基于信息交互的空间机器人的协同操作方法及装置。方法包括:基于目标任务确定多个空间机器人,每个空间机器人分别对应一个子任务和一个智能体网络,每个智能体网络均包括策略网络、评价网络、通讯网络和输出网络;构建每个智能体网络之间的联合操作模型,在联合操作模型中,每个智能体网络分别通过其通讯网络和输出网络与其它智能体网络进行信息交互;对联合操作模型进行训练,得到训练好的联合操作模型;将每个空间机器人基于其子任务获取的观测数据分别输入训练好的联合操作模型,得到每个空间机器人相应的操作策略。本发明,通过各机器人之间的协同工作,可以更好地完成目标任务。
-
公开(公告)号:CN104573193B
公开(公告)日:2017-07-28
申请号:CN201410790930.1
申请日:2014-12-18
Applicant: 北京控制工程研究所
IPC: G06F17/50
Abstract: 一种航天器GNC系统快速设计方法,步骤为:(1)将航天器GNC系统划分为动态模型和事件驱动模型,并分别采用Simulink模型库和Stateflow的有限状态机进行建模;(2)将安装有VxWorks操作系统的工控机作为运行GNC系统的硬件系统,把相关VxWorks驱动程序编写成Simulink的库文件;(3)在Simulink编辑环境中,根据信息流向和数据依存关系,把各模型和库文件进行连接,形成完整GNC系统的mdl文件;(4)将mdl文件转换为目标代码,对目标代码进行编译并链接辅助文件后生成可执行目标程序;(5)通过网络将可执行目标程序下载至工控机上,在工控机上运行可执行目标程序,由此得到一个GNC系统原型。
-
公开(公告)号:CN117508670A
公开(公告)日:2024-02-06
申请号:CN202311533613.7
申请日:2023-11-16
Applicant: 北京控制工程研究所
Abstract: 本发明涉及人工智能技术领域,特别涉及一种面向复杂任务的空间机器人操作方法及装置。方法包括:获取预先训练好的技能库,所述技能库中包括用于完成目标任务的多个子技能;将所述技能库和所述目标任务输入预先训练好的强化学习模型中,得到在不同时刻需要执行的子技能;其中,在不同时刻下,与所述目标任务相关的环境状态不同,每个子技能分别用于执行所述目标任务中的一个子任务,所述强化学习模型是基于所述技能库和预设任务训练得到的;基于各个子技能指导空间机器人依次完成相应子任务的空间操作,直至完成所述目标任务。本发明,可以使机器人准确地完成复杂的空间任务。
-
公开(公告)号:CN112255645B
公开(公告)日:2023-07-14
申请号:CN202010974462.9
申请日:2020-09-16
Applicant: 北京控制工程研究所
Abstract: 用于航天器快速交会对接的地面测试时间系统建立方法,将时间系统基准建立在地面动力学仿真计算机上,并可以利用GPS接收机给出的秒脉冲和秒脉冲对应的整秒UTC时间对星上控制计算机时间进行校正。本发明既可以用于测试星上控制计算机时钟漂移对控制系统性能的影响,又可以通过利用GPS秒脉冲校时的方法实现星地时间同步。本发明解决了现有校时策略中当星上时间发生改变时,亦会对动力学时间产生影响的问题,且无需星地之间的校时串口,可以更为真实的反映出星上时间系统的在轨状态,保证了地面测试的真实性和有效性,提高了地面测试系统的精确程度。
-
公开(公告)号:CN112255645A
公开(公告)日:2021-01-22
申请号:CN202010974462.9
申请日:2020-09-16
Applicant: 北京控制工程研究所
Abstract: 用于航天器快速交会对接的地面测试时间系统建立方法,将时间系统基准建立在地面动力学仿真计算机上,并可以利用GPS接收机给出的秒脉冲和秒脉冲对应的整秒UTC时间对星上控制计算机时间进行校正。本发明既可以用于测试星上控制计算机时钟漂移对控制系统性能的影响,又可以通过利用GPS秒脉冲校时的方法实现星地时间同步。本发明解决了现有校时策略中当星上时间发生改变时,亦会对动力学时间产生影响的问题,且无需星地之间的校时串口,可以更为真实的反映出星上时间系统的在轨状态,保证了地面测试的真实性和有效性,提高了地面测试系统的精确程度。
-
-
-
-
-
-
-
-