具有多传感器故障的模块化机器人输出反馈最优容错控制方法及系统

    公开(公告)号:CN118288291B

    公开(公告)日:2024-10-22

    申请号:CN202410566263.2

    申请日:2024-05-09

    Applicant: 安徽大学

    Abstract: 本发明涉及机器人容错控制技术领域,解决了随着模块化机器人中重构模块数量的增加,动态规划方法会引发“维数灾”问题,使得求解HJB方程变得更加困难的技术问题,尤其涉及一种具有多传感器故障的模块化机器人输出反馈最优容错控制方法,包括:引入低通滤波器,建立传感器故障与执行器故障之间的映射关系,并根据映射关系构建融合机器人系统状态和低通滤波器输出的增广系统;根据神经网络与机器人系统的输入/输出数据建立用以在线辨识机器人系统的动力学信息与传感器故障的联合输出型故障观测器。本发明所提出的方法适用于解决多种类型传感器故障系统的容错控制问题,能够达到满意的容错控制效果,满足应用需求,且可以减少设计成本。

    基于语义强化学习的自主水下机器人轨迹跟踪控制方法

    公开(公告)号:CN118331288B

    公开(公告)日:2024-08-23

    申请号:CN202410764660.0

    申请日:2024-06-14

    Applicant: 安徽大学

    Abstract: 本发明公开了基于语义强化学习的自主水下机器人轨迹跟踪控制方法,包括:获取海洋环境图像信息;进行强化学习训练,得到最优的运动决策;进行海洋环境特征点提取和语义理解,得到海洋环境语义;判断自主水下航行器的运动决策是否安全,若安全,则执行运动决策,否则对不安全的动作,在安全约束下利用强化学习重新做出新的运动决策,若仍不安全,则存储当前不安全事件并基于状态恢复机制重训练。本发明使自主水下机器人能够更好的理解环境信息以及变化,预测潜在的危险,能够保证自主水下机器人的安全性,一旦自主水下机器人发生碰撞,能够自动恢复到上一个最优安全状态,而不是恢复到初始状态重新开始训练,提高训练效率。

    基于多功能抓取及对象无关框架的机器人抓取方法及系统

    公开(公告)号:CN118493399A

    公开(公告)日:2024-08-16

    申请号:CN202410848632.7

    申请日:2024-06-27

    Applicant: 安徽大学

    Abstract: 本发明提供一种基于多功能抓取及对象无关框架的机器人抓取方法及系统,涉及机器人智能控制领域。所述方法包括:对训练集中的RGB图像信息进行预处理,得到处理后的RGB图像信息;根据处理后的RGB图像信息和深度信息,搭建抓取检测模型;基于IOU计算得到损失计算策略;基于损失计算策略,对抓取检测模型进行训练,得到携带最优的权重参数的抓取检测模型;控制器根据携带最优的权重参数的抓取检测模型,建立抓取位姿配置在相机坐标系与世界坐标系间的转化关系,得到三维世界坐标系下的抓取位姿;机器人根据三维世界坐标系下的抓取位姿,将物体运输至制定的目标位置,本发明提升了机器人抓取物体的能力。

    基于混合动作空间强化学习的远洋海岛群能量管理方法

    公开(公告)号:CN117350496B

    公开(公告)日:2024-05-24

    申请号:CN202311337880.7

    申请日:2023-10-17

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于混合动作空间强化学习的远洋海岛群能量管理方法,方法包括:海岛能量枢纽模型构建,以描述满足海岛多元能源需求的能量转换;海岛间船舶能量传输模型构建,用于表征船舶动态运输过程;根据海岛能量枢纽模型和船舶能量传输模型,建立海岛群综合能源系统能源管理模型;建立包含混合动作空间的深度强化学习方法进行能量管理策略求解。本发明基于一种包含混合动作空间的深度强化学习方法解决海岛群综合能源系统能量管理问题,其考虑了海岛群环境的强不确定性和动态特性,满足对极端环境变化的自适应性,同时,与其他算法相比本发明提出的方法可在不改变模型结构的条件下实现海岛群能量管理策略的快速求解。

    基于改进PPO算法的多无人机路径规划方法

    公开(公告)号:CN117193378B

    公开(公告)日:2024-04-12

    申请号:CN202311379378.2

    申请日:2023-10-24

    Applicant: 安徽大学

    Abstract: 本发明公开了基于改进PPO算法的多无人机路径规划方法,包括:建立多无人机路径规划模型,将多无人机路径规划问题描述为马尔科夫决策过程,并建立RB‑PPO算法的状态空间、动作空间、actor网络、critic网络及奖励函数;执行训练任务,判断是否达到策略更新条件,若没有达到,则初始化无人机的数量和状态,收集无人机与环境互动过程中获得的数据并将其添加到重放缓冲区R中,若达到,则从R中取出样本数据;根据从R中取出的数据,使用状态价值网络获得状态值V,使用V‑trace方法估计状态值v‑target,计算优势函数;更新策略网络;更新状态价值网络。本发明有效地解决PPO算法在多无人机路径规划中只能使用当前策略生成的数据进行更新的问题,从而显著提高了样本效率。

    一种基于多智能体强化学习的远洋海岛群能量流调度方法

    公开(公告)号:CN117350515B

    公开(公告)日:2024-04-05

    申请号:CN202311578796.4

    申请日:2023-11-21

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于多智能体强化学习的远洋海岛群能量流调度方法,方法包括:海岛群能量流传输模式设计,以用于描述海岛群间能量传输过程;根据海岛群能量流传输模式,构建海岛群能量流传输模型;根据海岛群能量流传输模型,建立海岛群能源系统能量管理模型;使用多智能体强化学习方法实现海岛群能量流调度,并对能量管理策略求解。本发明基于多智能体强化学习方法,考虑海岛群的布局特点、可再生能源禀赋及电力船舶的移动储能特性,以满足对人居岛负载需求变化的自适应性。与其他算法相比本发明提出的方法在集中式训练、分布式执行的基础上,加入了基线函数,以提高算法的学习效率和稳定性,高效地处理远洋海岛群的能量流调度和能量管理问题。

    一种基于多目标优化的飞行机器人轨迹规划方法

    公开(公告)号:CN117250855B

    公开(公告)日:2024-02-13

    申请号:CN202311507034.5

    申请日:2023-11-14

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于多目标优化的飞行机器人轨迹规划方法,包括S1、采用n阶多项式曲线来参数化轨迹,整条轨迹由m个时间间隔的y维空间轨迹构成,飞行机器人运动轨迹包含四旋翼飞行器空间轨迹和机器人关节轨迹;S2、融合整条轨迹的目标函数和运动时间得到总成本函数;S3、建立轨迹端点约束方程,结合总成本函数构建有约束的二次规划方程;S4、通过解析法求解二次规划方程中轨迹的多项式系数和运动时间,生成优化轨迹;S5、根据作业任务要求,分别设置旋翼飞行器和机器人的不同路径点,并通过统一的规划时间来实现两者的同步运动。本发明通过时间的同步来统一旋翼飞行器和机器人的运动,使得飞行机器人的轨迹具有平滑性且高效性,实(56)对比文件Sun, J.etc.Nonlinear RobustCompensation Method for TrajectoryTracking Control of Quadrotors.IEEEACCESS.2019,(第7期),全文.

    一种机器人笛卡尔空间的时间最优轨迹规划方法

    公开(公告)号:CN117260746A

    公开(公告)日:2023-12-22

    申请号:CN202311565023.2

    申请日:2023-11-22

    Applicant: 安徽大学

    Abstract: 本发明涉及一种机器人笛卡尔空间的时间最优轨迹规划方法,包括S1、在机器人示教盒上对目标点进行示教,两个目标点之间构成笛卡尔空间直线路径;S2、通过归一化因子统一机器人笛卡尔空间直线路径的位置向量和姿态向量,从而生成总路径长度;S3、建立机器人笛卡尔空间的路径约束方程;S4、建立时间最优化轨迹规划的目标函数;S5、通过最大路径加速度的时间积分来得到最大的路径速度;S6、生成时间最优轨迹。本发明将机器人位置和姿态规划通过归一化来统一处理,将机器人的动力学方程和驱动力矩特性作为约束条件,并通过时间最优算法来生成优化轨迹;本发明方法具有易执行,高效率,轨迹平滑的特点,可广泛应用于机器人轨迹规划领域。

    一种基于深度强化学习的无人机中继式导航方法

    公开(公告)号:CN116817909A

    公开(公告)日:2023-09-29

    申请号:CN202310280577.1

    申请日:2023-03-22

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于深度强化学习的无人机中继式导航方法,包括:收集无人机在执行中继式导航任务时的无人机状态向量;构建深度强化学习网络,依次将无人机状态向量输入深度强化学习网络中,输出最优参数化动作,并根据最优参数化动作进行原始经验存储和原始经验扩充,更新深度强化学习网络,直至达到最大训练回合数,完成对深度强化学习网络的训练;重新获取一架无人机状态向量,输入到训练好的深度强化学习网络中,得到无人机的最优参数化动作,通过无人机的最优参数化动作指引无人机中继式导航。本发明在多阶段导航这类中继式任务中自主规划无人机路径,实现导航过程。

    一种基于FasterR-CNN和GRCNN的机械臂智能抓取方法及系统

    公开(公告)号:CN116673962A

    公开(公告)日:2023-09-01

    申请号:CN202310848848.9

    申请日:2023-07-12

    Applicant: 安徽大学

    Abstract: 本发明属于机器人智能控制技术领域,具体涉及一种基于Faster R‑CNN和GRCNN的机械臂智能抓取方法及系统;方法包括Faster R‑CNN网络模型检测物体类别和位置,再将检测到的目标物体对应像素的深度图像部分提取出来后,经过处理输入到GRCNN网络模型中,GRCNN网络模型输出置信度最高的像素点作为抓取点,这组置信度最高的抓取点经过相机坐标系和机器人坐标系的转换后,得到机器人坐标系下的抓取位姿表示模型。最后这组抓取位姿表示模型被送入到机械臂的控制器中,控制器控制机械臂执行抓取任务;本发明实现机械臂与外界环境的交互感知,适用于大量未知物体的抓取检测。机械臂具有自主识别和智能决策能力,提升抓取检测的成功率,整个的抓取方案具有任务泛化性。

Patent Agency Ranking