基于改进TD3算法的无人机自主导航方法

    公开(公告)号:CN118963407A

    公开(公告)日:2024-11-15

    申请号:CN202411065005.2

    申请日:2024-08-05

    Applicant: 安徽大学

    Abstract: 本发明公开一种基于改进TD3算法的无人机自主导航方法,包括:设计改进TD3算法的状态空间、动作空间、奖励函数、策略网络、价值网络、成功经验池及失败经验池;初始化状态和临时经验池,策略网络收集数据添加到临时经验池,临时经验池数据溢出则将溢出数据添加到成功经验池;判断是否达到更新条件,达到更新条件,从成功经验池和失败经验池中按照比例随机采样数据,用采样数据更新价值网络和策略网络;未达到更新条件,判断无人机是否达到终止状态,达到成功的终止状态时,将临时经验池的数据全部放到成功经验池,若是失败的终止状态,将临时经验池的数据全部放到失败经验池。本发明提高了采样数据的质量,从而提升无人机自主导航的效率。

    基于动力学参数辨识和快速终端滑模协作机器人控制方法

    公开(公告)号:CN117681212B

    公开(公告)日:2024-05-14

    申请号:CN202410143186.X

    申请日:2024-02-01

    Applicant: 安徽大学

    Abstract: 本发明涉及基于动力学参数辨识和快速终端滑模协作机器人控制方法,包括:通过拉格朗日法建立协作机器人的动力学模型;通过动力学参数辨识来估算获得精确的动力学参数,将精确的动力学参数代入动力学模型中,获得估计的动力学方程;计算关节跟踪误差并设计快速终端滑模面;在估计的动力学方程的基础上,设计快速终端滑模面的趋近律和控制方程;使用设计的控制方程来跟踪梯形速度轨迹,已验证控制方案的有效性。本发明的协作机器人控制方法是一种基于动力学模型的滑模鲁棒控制,首先,通过动力学参数辨识获得估计的动力学方程。其次,以动力学为基础,设计新的快速终端滑模面和趋近律,以提高跟踪误差收敛速度和系统鲁棒性,具有广阔的应用前景。

    一种多旋翼无人机抓取轨迹设计方法、装置、设备及介质

    公开(公告)号:CN117631691B

    公开(公告)日:2024-04-12

    申请号:CN202410103249.9

    申请日:2024-01-25

    Applicant: 安徽大学

    Abstract: 本发明涉及一种多旋翼无人机抓取轨迹设计方法、装置、设备及介质,包括:对机载相机采集的位置信息进行滤波处理,获取滤波后的目标物位置信息;获取滤波后的目标物位置信息后,以当前位置作为起点,以目标物位置作为抓取点,在抓取平面的前进方向上增加一个合理高度的终点,设计由起点、抓取点和终点3个路径点组成的抓取轨迹;模仿老鹰捕猎飞行曲线来建立抓取轨迹的目标函数,并通过求解目标函数的最小值来生成最优抓取轨迹;通过时间缩放方法来改变生成的最优抓取轨迹的运动时间,得到经过时间缩放后的新抓取轨迹,实现抓取轨迹调速功能。本发明设计的空中抓取轨迹有很好的仿生性和速度可调性,能够提高空中抓取作业的成功率,实际可行性强。

    基于动力学参数辨识和快速终端滑模协作机器人控制方法

    公开(公告)号:CN117681212A

    公开(公告)日:2024-03-12

    申请号:CN202410143186.X

    申请日:2024-02-01

    Applicant: 安徽大学

    Abstract: 本发明涉及基于动力学参数辨识和快速终端滑模协作机器人控制方法,包括:通过拉格朗日法建立协作机器人的动力学模型;通过动力学参数辨识来估算获得精确的动力学参数,将精确的动力学参数代入动力学模型中,获得估计的动力学方程;计算关节跟踪误差并设计快速终端滑模面;在估计的动力学方程的基础上,设计快速终端滑模面的趋近律和控制方程;使用设计的控制方程来跟踪梯形速度轨迹,已验证控制方案的有效性。本发明的协作机器人控制方法是一种基于动力学模型的滑模鲁棒控制,首先,通过动力学参数辨识获得估计的动力学方程。其次,以动力学为基础,设计新的快速终端滑模面和趋近律,以提高跟踪误差收敛速度和系统鲁棒性,具有广阔的应用前景。

    基于改进PPO算法的多无人机路径规划方法

    公开(公告)号:CN117193378A

    公开(公告)日:2023-12-08

    申请号:CN202311379378.2

    申请日:2023-10-24

    Applicant: 安徽大学

    Abstract: 本发明公开了基于改进PPO算法的多无人机路径规划方法,包括:建立多无人机路径规划模型,将多无人机路径规划问题描述为马尔科夫决策过程,并建立RB‑PPO算法的状态空间、动作空间、actor网络、critic网络及奖励函数;执行训练任务,判断是否达到策略更新条件,若没有达到,则初始化无人机的数量和状态,收集无人机与环境互动过程中获得的数据并将其添加到重放缓冲区R中,若达到,则从R中取出样本数据;根据从R中取出的数据,使用状态价值网络获得状态值V,使用V‑trace方法估计状态值v‑target,计算优势函数;更新策略网络;更新状态价值网络。本发明有效地解决PPO算法在多无人机路径规划中只能使用当前策略生成的数据进行更新的问题,从而显著提高了样本效率。

    基于强化学习的四旋翼无人机预置性能跟踪控制方法

    公开(公告)号:CN116661478A

    公开(公告)日:2023-08-29

    申请号:CN202310930078.2

    申请日:2023-07-27

    Applicant: 安徽大学

    Abstract: 本发明公开了基于强化学习的四旋翼无人机预置性能跟踪控制方法,包括:构建姿态跟踪误差模型;基于离散化后的姿态跟踪误差模型构造四旋翼无人机长期代价函数,形成积分强化学习的实时奖励函数;构建评价神经网络,基于评价神经网络对长期代价函数的估计值,构建积分强化学习的误差模型,结合实时奖励函数,建立评价神经网络‑动作神经网络积分强化学习控制模型;对控制模型中的评价神经网络、动作神经网络分别设计权重更新律,使用采用所述权重更新律的积分强化学习控制模型对四旋翼无人机姿态进行跟踪控制。本发明能够保证提高四旋翼无人机的瞬态性能、系统闭环稳定和输出跟踪,提高四旋翼无人机的自主性、对新场景的适应性。

    一种面向拜占庭攻击下鲁棒联邦学习的分布式压缩随机聚合方法

    公开(公告)号:CN119129776B

    公开(公告)日:2025-04-18

    申请号:CN202411269775.9

    申请日:2024-09-11

    Applicant: 安徽大学

    Abstract: 本发明公开一种面向拜占庭攻击下鲁棒联邦学习的分布式压缩随机聚合方法,针对在大规模分布式集群上面临的拜占庭式攻击后的潜在漏洞,及多智能体信息通讯对通信带宽和计算资源的影响,提出一种抵御攻击并降低通信损耗的算法,实现系统鲁棒稳定、通信高效和客户端隐私安全。本算法将损失函数与惩罚项相结合,保持对拜占庭攻击的弹性;引入参数压缩算子,降低通信成本;量化权重和特征降维,降低数据维数或大小,加快算法收敛;上传、下发的参数都经过有损压缩,实现数据加密,确保隐私和安全性。具有抗干扰能力强,通信成本低,隐私安全性高的优点,可广泛应用于多个领域,尤其适用于存在数据隐私需求高和通信资源受限的应用系统。

    一种面向拜占庭攻击下鲁棒联邦学习的分布式压缩随机聚合算法

    公开(公告)号:CN119129776A

    公开(公告)日:2024-12-13

    申请号:CN202411269775.9

    申请日:2024-09-11

    Applicant: 安徽大学

    Abstract: 本发明公开一种面向拜占庭攻击下鲁棒联邦学习的分布式压缩随机聚合算法,针对在大规模分布式集群上面临的拜占庭式攻击后的潜在漏洞,及多智能体信息通讯对通信带宽和计算资源的影响,提出一种抵御攻击并降低通信损耗的算法,实现系统鲁棒稳定、通信高效和客户端隐私安全。本算法将损失函数与惩罚项相结合,保持对拜占庭攻击的弹性;引入参数压缩算子,降低通信成本;量化权重和特征降维,降低数据维数或大小,加快算法收敛;上传、下发的参数都经过有损压缩,实现数据加密,确保隐私和安全性。具有抗干扰能力强,通信成本低,隐私安全性高的优点,可广泛应用于多个领域,尤其适用于存在数据隐私需求高和通信资源受限的应用系统。

    一种基于改进RRT*融合算法的博物馆导览机器人路径规划方法

    公开(公告)号:CN118936500A

    公开(公告)日:2024-11-12

    申请号:CN202411003911.X

    申请日:2024-07-25

    Applicant: 安徽大学

    Abstract: 本发明涉及可移动机器人路径规划应用技术领域,尤其涉及一种基于改进RRT*融合算法的博物馆导览机器人路径规划方法。本发明先将RRT*算法的输出结果使用蚁群算法进一步优化,获得更好的静态路径,再在路径跟随中结合改进后的DWA算法,进行动态避障。通过三种算法的结合,既优化了静态路径的长度、拐点数和平滑度,又能解决动态环境的适应性问题。使得导览机器人可以凭借内置的传感器和地图数据,在博物馆内自主导航,避开障碍物,通过语音识别技术理解游客的问题和指令,使用自然语言处理技术生成回答,并通过语音合成技术以自然的声音回应游客,在紧急情况下,如火灾或游客受伤,还能提供紧急信息并协助疏散。

Patent Agency Ranking