-
公开(公告)号:CN118578396B
公开(公告)日:2024-11-08
申请号:CN202410831223.6
申请日:2024-06-26
Applicant: 安徽大学
IPC: B25J9/16
Abstract: 本发明公开了一种基于时序任务持续强化学习的机械臂抓取策略优化方法,包括步骤1:收集机械臂在执行到达任务时的机械臂的状态向量及目标位置;步骤2:构建深度强化学习的神经网络模型;步骤3:根据机械臂在执行序列任务的到达任务时的机械臂的状态向量及目标位置训练网络模型,得到模型Ⅰ;步骤4:机械臂执行模型Ⅰ,当到达目标位置时,进行抓取任务的训练,得到模型Ⅱ;步骤5:使用模型Ⅰ对模型Ⅱ进行蒸馏得到模型Ⅲ,得到优化后的机械臂抓取策略;步骤6:评估模型Ⅲ的性能,检查其在不同任务场景上的表现步骤以确认模型Ⅲ是否收敛。本发明在时序任务持续强化学习的机械臂抓取中表现出更快的收敛速度和更短的抓取时间。
-
公开(公告)号:CN118758304A
公开(公告)日:2024-10-11
申请号:CN202410727267.4
申请日:2024-06-06
Applicant: 安徽大学
Abstract: 本发明公开了一种基于激光slam的无人机自适应型质心点边界探索方法,包括设定区域边界,加载环境配置参数;构建栅格地图;利用加权质心法检测识别边界点,将被已探索区域包围的未知区域归纳为已探索区域;通过能源效率加权找到当前收益价值最高的边界点作为无人机的探索点;自适应无人机感知半径调整;障碍物代价优化路径规划。本发明在边界识别方面引入加权质心,以未知区域的质心点为边界探索点并加以推断,有效增加了探索的效率,避免浪费算力,在边界探索方面采用综合距离、能源消耗效率和动态感知调整的方法,同时考虑带障碍物代价的优化路径规划,可准确反映真实世界中的探索建图挑战,为机器人提供更为安全、高效和适应性强的方案。
-
公开(公告)号:CN118447341A
公开(公告)日:2024-08-06
申请号:CN202410906142.8
申请日:2024-07-08
Applicant: 安徽大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V20/50
Abstract: 本发明涉及无人机着陆识别技术领域,解决了传统方法无法适用于无人机面向紧急情况下实现自主着陆的技术问题,尤其涉及一种基于ST‑Swin‑T神经网络面向无人机自主着陆的场景图识别方法,包括:构建针对无人机着陆场景的数据集,并根据若干着陆场景类别将数据集分为多个安全等级;基于Swin‑T神经网络的骨干网络构建用于对无人机着陆的着陆场景图进行分类识别的识别模型ST‑Swin‑T;基于预训练模型对识别模型ST‑Swin‑T进行训练。本发明能够在面对紧急着陆场景时,通过直接检测下方的图像来判断能否降落,无需复杂计算或精确降落于特定点。并且显著提升了无人机的飞行安全性,同时为其自主学习识别着陆场景奠定了基础。
-
公开(公告)号:CN115424076B
公开(公告)日:2024-03-15
申请号:CN202211131518.X
申请日:2022-09-16
Applicant: 安徽大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/24 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于自适应池化方式的图像分类方法,将当前池化层的输入特征图按照池化层所给定的卷积核尺寸、步长和填充的大小,使用滑动窗口的方式分别展开为n个区域,每个区域分别对应有一个α值,采用自适应的方式,将特征图对应的n个区域经过采样后得到一系列t分布,再将其经过仿射变换后,结合当前的α值,动态地去调整α值的大小,进而就控制自适应池化动态的去改变输出特征点的选择,再将池化后的特征值折叠起来,就得到使用了不同程度的池化方式所对应的输出特征图。通过本发明,解决了传统图像分类中只能使用最大池化或者平均池化所带来的保留的信息不够准确等问题,从而能更好的利用的数据的实际情况,提高了模型分类的准确率。
-
公开(公告)号:CN117687417A
公开(公告)日:2024-03-12
申请号:CN202410119896.9
申请日:2024-01-29
Applicant: 安徽大学
IPC: G05D1/43 , G05D1/644 , G05D1/648 , G05D105/20
Abstract: 本发明涉及一种工业机器人外部运动轨迹规划方法及系统,包括以下步骤:S1、输入外部运动轨迹,所述轨迹由多个离散数据点组成;S2、对输入的离散数据点进行数据校验,以去除不合理的离散数据点;S3、调用各种运动插补函数来拟合校验剔除后的离散数据点;S4、控制轨迹的启动和停止,并生成缓慢停止轨迹;S5、实现轨迹的实时调速,以满足用户对不同的速度要求;本发明实现了工业机器人外部轨迹控制,且运动路径具有轨迹平滑和速度可调等优点,实际可行性高。
-
公开(公告)号:CN117313826B
公开(公告)日:2024-02-23
申请号:CN202311615603.8
申请日:2023-11-30
Applicant: 安徽大学
Abstract: 本发明公开了一种基于强化学习的任意角度倒立摆模型训练方法,包括:获得小车一阶倒立摆状态向量;获得环境返回的值函数数组;计算下一状态的状态向量,返回执行本次动作所获得的奖励和一个判断环境是否结束的结束标识;将当前状态、下一状态、奖励、结束标识、所选动作作为一个元组存入到经验回放池中;从经验回放池中随机抽取一批元组;根据时序差分算法,计算损失函数,并更新神经网络,使得损失减小,直到通过结束标识判断出环境结束,完成网络模型训练,并通过训练好的模型来训练不同角度的模型。本发明考虑到不同角度训练的异同,把角度作为神经网络输入元素的一部分,使模型可以根据不同角度给出不同的动作选择,使训练更灵(56)对比文件王红睿;赵黎明.基于增强学习规则的倒立摆模糊神经网络控制器.吉林大学学报(信息科学版).2006,(05),全文.
-
公开(公告)号:CN117114088B
公开(公告)日:2024-01-19
申请号:CN202311338634.3
申请日:2023-10-17
Applicant: 安徽大学
Abstract: 本发明公开了一种基于统一AI框架的深度强化学习智能决策平台,通过参数配置模块选定深度强化学习模型的参数,利用通用模块对选定的参数进行读取,根据读取到的参数,从模型库中调取并创建相应的表征器、策略模块、学习器以及智能体,在创建策略和学习器的过程中,从数学工具中调取必要的函数定义以及优化器;同时,根据读取到的参数,在原始环境基础上创建向量环境,并实例化环境,将实例化环境和智能体输入运行器中计算动作输出,并在环境中执行动作,实现智能决策。该智能决策平台对不同功能和结构的深度强化学习模型进行模块化设计,从而兼容多种AI框架。
-
公开(公告)号:CN117387635A
公开(公告)日:2024-01-12
申请号:CN202311707956.0
申请日:2023-12-13
Applicant: 安徽大学
Abstract: 本发明涉及一种基于深度强化学习和PID控制器的无人机导航方法,包括:获取无人机执行导航任务时的无人机状态向量;构建深度强化学习网络,将无人机状态向量输入深度强化学习网络中获取原始经验并将原始经验存储进原始经验存储池中;将原始经验存储池中的原始经验输入经验扩展模块得到扩展经验,利用扩展经验更新深度强化学习网络得到训练后的深度强化学习模型;重新获取无人机状态向量,输入到训练后的深度强化学习网络中,输出控制命令指引无人机完成导航。本发明在包含真实动力学的无人机导航任务中高效规划无人机路径,并使用PID控制器控制高仿真无人机飞行,最终使无人机沿着高效路径安全、平稳、无碰撞地到达目标区域,实现避障导航全过程。
-
公开(公告)号:CN117313826A
公开(公告)日:2023-12-29
申请号:CN202311615603.8
申请日:2023-11-30
Applicant: 安徽大学
Abstract: 本发明公开了一种基于强化学习的任意角度倒立摆模型训练方法,包括:获得小车一阶倒立摆状态向量;获得环境返回的值函数数组;计算下一状态的状态向量,返回执行本次动作所获得的奖励和一个判断环境是否结束的结束标识;将当前状态、下一状态、奖励、结束标识、所选动作作为一个元组存入到经验回放池中;从经验回放池中随机抽取一批元组;根据时序差分算法,计算损失函数,并更新神经网络,使得损失减小,直到通过结束标识判断出环境结束,完成网络模型训练,并通过训练好的模型来训练不同角度的模型。本发明考虑到不同角度训练的异同,把角度作为神经网络输入元素的一部分,使模型可以根据不同角度给出不同的动作选择,使训练更灵活、更通用。
-
公开(公告)号:CN117311147A
公开(公告)日:2023-12-29
申请号:CN202311244051.4
申请日:2023-09-25
Applicant: 安徽大学
IPC: G05B13/04
Abstract: 本发明公开了基于双层级观测器的模块化机器人分散最优容错控制系统与方法,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,构建第一层级观测器以辨识子系统动力学模型,建立增广子系统以及相应的最优代价函数,得到HJB方程,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律,在机器人系统发生执行器乘性故障时,构建第二层级观测器,以估计执行器有效因子,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。本发明能够达到满意的容错控制效果,满足应用需求。
-
-
-
-
-
-
-
-
-