-
公开(公告)号:CN115374933A
公开(公告)日:2022-11-22
申请号:CN202210729574.7
申请日:2022-06-24
Applicant: 北京理工大学
IPC: G06N3/08
Abstract: 本发明涉及一种多节点探测器着陆行为智能规划及决策方法,属于航天器控制和人工智能技术领域。本发明利用多智能体强化学习来端到端地完成探测器着陆行为规划决策,采用“集中训练分布执行”的训练范式,智能体以局部观测作为Actor网络的输入,以全局观测作为Critic网络的输入,达到了智能体之间信息交互的目的。同时,本发明将基于模型的元学习方法融入本发明方法中,在Actor和Critic网络中嵌入GRU模块实现历史经验的存储与利用,使智能体在面对不确定环境时具有更好的鲁棒性,最终使获得的策略能够指导探测器各节点应对不确知的小行星环境,显著降低了探测器着陆时发生反弹、滚转、倾覆的概率。
-
公开(公告)号:CN112214031A
公开(公告)日:2021-01-12
申请号:CN202011020048.0
申请日:2020-09-25
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于遗传粒子群算法的探测器多节点协同着陆位置规划方法,属于航天深空探测技术领域和人工智能技术领域。本发明方法,针对多着陆节点探测器系统的着陆位置规划问题,采用栅格图处理着陆区地图数据和障碍物信息,通过对粒子群算法进行离散化,融合遗传机制中的交叉变异操作,加入自适应遗传因子控制变异操作的发生概率,增强了算法的全局搜索能力。本方法能够有效处理多着陆节点探测器系统的防干涉约束和连接约束,生成满足距离约束的探测器着陆点,防止探测器节点间发生碰撞以及与地面障碍物发生碰撞,并保持存在柔性物理连接的节点之间均衡分布,增大探测器着陆的稳定性和安全性。
-
公开(公告)号:CN113311829A
公开(公告)日:2021-08-27
申请号:CN202110510381.8
申请日:2021-05-11
Applicant: 北京理工大学
IPC: G05D1/02
Abstract: 本发明涉及一种基于动态时间窗冲突搜索的多机器人路径规划方法,属于人工智能与机器人控制技术领域。本发明能够在任务即时进入多机器人系统时,通过动态时间窗和动态重新规划频率的方法为各机器人规划任务执行路径,同时当机器人数量巨大时,仍能够为多机器人系统规划出无碰撞的路径。动态窗口和规划频率的引入,大大提高了求解效率,并解决了任务即时进入系统的问题。本发明具备良好的鲁棒性和实际应用价值,实现了快速为巨大数量的多机器人系统规划无碰撞路径。本发明均具备很强的扩展性,适用于各种移动机器人的动态任务路径规划场景。
-
公开(公告)号:CN112214031B
公开(公告)日:2021-08-20
申请号:CN202011020048.0
申请日:2020-09-25
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于遗传粒子群算法的探测器多节点协同着陆位置规划方法,属于航天深空探测技术领域和人工智能技术领域。本发明方法,针对多着陆节点探测器系统的着陆位置规划问题,采用栅格图处理着陆区地图数据和障碍物信息,通过对粒子群算法进行离散化,融合遗传机制中的交叉变异操作,加入自适应遗传因子控制变异操作的发生概率,增强了算法的全局搜索能力。本方法能够有效处理多着陆节点探测器系统的防干涉约束和连接约束,生成满足距离约束的探测器着陆点,防止探测器节点间发生碰撞以及与地面障碍物发生碰撞,并保持存在柔性物理连接的节点之间均衡分布,增大探测器着陆的稳定性和安全性。
-
公开(公告)号:CN113281993A
公开(公告)日:2021-08-20
申请号:CN202110509976.1
申请日:2021-05-11
Applicant: 北京理工大学
IPC: G05B13/02
Abstract: 本发明涉及一种贪心K‑均值自组织神经网络多机器人路径规划方法,属于人工智能和机器人系统控制技术领域。本方法将任务分配问题和路径规划问题结合考虑,采用两阶段求解方式,在第一阶段完成机器人任务分配,在第二阶段,根据第一阶段任务分配结果进行路径规划。通过在K‑均值迭代过程中,使用贪心算法来预估各机器人执行任务所需的路径代价,通过路径代价指导调节因子大小,通过调节因子来调整聚类过程中的任务分配结果,改善了K‑均值聚类算法自组织神经网络算法的机器人负载不均衡的问题,为各机器人高效规划负载均衡的任务执行路径方案,具有通用性和鲁棒性强的优点。
-
公开(公告)号:CN110861089A
公开(公告)日:2020-03-06
申请号:CN201911199613.1
申请日:2019-11-29
Applicant: 北京理工大学
IPC: B25J9/16 , G05B19/418
Abstract: 本发明涉及一种多机器人系统任务均衡分配协同工作控制方法,人工智能和机器人控制技术领域。针对多机器人系统作业任务点呈离散固定态,为有效解决多台机器人之间的任务分配问题,通过改进K-means算法,首先对所有任务点进行聚类,对聚类后的任务点建模,然后使用自适应缩放聚类空间方式,让不同机器人所分配的任务点的规划数量尽可能相等,方法简练、实用性强。能够有效解决多机器人系统自动化作业过程中面临的机器人任务分配问题。
-
-
公开(公告)号:CN113281993B
公开(公告)日:2022-05-27
申请号:CN202110509976.1
申请日:2021-05-11
Applicant: 北京理工大学
IPC: G05B13/02
Abstract: 本发明涉及一种贪心K‑均值自组织神经网络多机器人路径规划方法,属于人工智能和机器人系统控制技术领域。本方法将任务分配问题和路径规划问题结合考虑,采用两阶段求解方式,在第一阶段完成机器人任务分配,在第二阶段,根据第一阶段任务分配结果进行路径规划。通过在K‑均值迭代过程中,使用贪心算法来预估各机器人执行任务所需的路径代价,通过路径代价指导调节因子大小,通过调节因子来调整聚类过程中的任务分配结果,改善了K‑均值聚类算法自组织神经网络算法的机器人负载不均衡的问题,为各机器人高效规划负载均衡的任务执行路径方案,具有通用性和鲁棒性强的优点。
-
公开(公告)号:CN113408796A
公开(公告)日:2021-09-17
申请号:CN202110622474.X
申请日:2021-06-04
Applicant: 北京理工大学
Abstract: 本发明涉及一种多任务深度强化学习的深空探测器软着陆路径规划方法,属于人工智能与深空探测技术领域。本发明基于深度确定性策略强化学习算法DDPG,采用多任务学习,充分利用智能体之间的对抗与协作关系,提升了每个智能体应对不确定情况的能力,提高模型整体的泛化性能。通过采用融合时间上下文信息的自注意力机制,不仅避免智能体陷入局部最优状态,而且使智能体更加聚焦到有利于自身获得最大回报的信息进行学习,进一步提高探测器着陆的成功率。本方法能够实现深空探测器的稳定着陆,为后续实现小行星探测、自主取样和航天员登陆活动奠定基础。
-
公开(公告)号:CN113408796B
公开(公告)日:2022-11-04
申请号:CN202110622474.X
申请日:2021-06-04
Applicant: 北京理工大学
Abstract: 本发明涉及一种多任务深度强化学习的深空探测器软着陆路径规划方法,属于人工智能与深空探测技术领域。本发明基于深度确定性策略强化学习算法DDPG,采用多任务学习,充分利用智能体之间的对抗与协作关系,提升了每个智能体应对不确定情况的能力,提高模型整体的泛化性能。通过采用融合时间上下文信息的自注意力机制,不仅避免智能体陷入局部最优状态,而且使智能体更加聚焦到有利于自身获得最大回报的信息进行学习,进一步提高探测器着陆的成功率。本方法能够实现深空探测器的稳定着陆,为后续实现小行星探测、自主取样和航天员登陆活动奠定基础。
-
-
-
-
-
-
-
-
-