基于状态熵激励的强化学习无人机密集障碍环境下导航策略优化方法

    公开(公告)号:CN118938988A

    公开(公告)日:2024-11-12

    申请号:CN202411003909.2

    申请日:2024-07-25

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于状态熵激励的强化学习无人机密集障碍环境下导航策略优化方法,包括:初始化环境;获取无人机初始状态信息;将初始状态信息输入策略网络得到动作信息,计算下一状态和外部奖励,再记录判断是否终止的结束标识,并一起存入经验回放池,从回放池中随机抽取一批元组样本,计算抽取样本的状态熵来得到内在奖励,合并为总奖励;利用总奖励来更新价值网络参数,通过策略梯度优化策略网络;定期更新目标策略网络和目标价值网络的参数,评估当前策略的表现。本发明引入状态熵作为内在奖励,显著提升了无人机在密集障碍环境中探索的效率,结合外部奖励和内在奖励,该方法使得无人机能够快速学习最佳路径,同时追求全局最优解。

    一种基于多目标优化的飞行机器人轨迹规划方法

    公开(公告)号:CN117250855B

    公开(公告)日:2024-02-13

    申请号:CN202311507034.5

    申请日:2023-11-14

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于多目标优化的飞行机器人轨迹规划方法,包括S1、采用n阶多项式曲线来参数化轨迹,整条轨迹由m个时间间隔的y维空间轨迹构成,飞行机器人运动轨迹包含四旋翼飞行器空间轨迹和机器人关节轨迹;S2、融合整条轨迹的目标函数和运动时间得到总成本函数;S3、建立轨迹端点约束方程,结合总成本函数构建有约束的二次规划方程;S4、通过解析法求解二次规划方程中轨迹的多项式系数和运动时间,生成优化轨迹;S5、根据作业任务要求,分别设置旋翼飞行器和机器人的不同路径点,并通过统一的规划时间来实现两者的同步运动。本发明通过时间的同步来统一旋翼飞行器和机器人的运动,使得飞行机器人的轨迹具有平滑性且高效性,实(56)对比文件Sun, J.etc.Nonlinear RobustCompensation Method for TrajectoryTracking Control of Quadrotors.IEEEACCESS.2019,(第7期),全文.

    一种机器人笛卡尔空间的时间最优轨迹规划方法

    公开(公告)号:CN117260746A

    公开(公告)日:2023-12-22

    申请号:CN202311565023.2

    申请日:2023-11-22

    Applicant: 安徽大学

    Abstract: 本发明涉及一种机器人笛卡尔空间的时间最优轨迹规划方法,包括S1、在机器人示教盒上对目标点进行示教,两个目标点之间构成笛卡尔空间直线路径;S2、通过归一化因子统一机器人笛卡尔空间直线路径的位置向量和姿态向量,从而生成总路径长度;S3、建立机器人笛卡尔空间的路径约束方程;S4、建立时间最优化轨迹规划的目标函数;S5、通过最大路径加速度的时间积分来得到最大的路径速度;S6、生成时间最优轨迹。本发明将机器人位置和姿态规划通过归一化来统一处理,将机器人的动力学方程和驱动力矩特性作为约束条件,并通过时间最优算法来生成优化轨迹;本发明方法具有易执行,高效率,轨迹平滑的特点,可广泛应用于机器人轨迹规划领域。

    一种基于深度强化学习的无人机中继式导航方法

    公开(公告)号:CN116817909A

    公开(公告)日:2023-09-29

    申请号:CN202310280577.1

    申请日:2023-03-22

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于深度强化学习的无人机中继式导航方法,包括:收集无人机在执行中继式导航任务时的无人机状态向量;构建深度强化学习网络,依次将无人机状态向量输入深度强化学习网络中,输出最优参数化动作,并根据最优参数化动作进行原始经验存储和原始经验扩充,更新深度强化学习网络,直至达到最大训练回合数,完成对深度强化学习网络的训练;重新获取一架无人机状态向量,输入到训练好的深度强化学习网络中,得到无人机的最优参数化动作,通过无人机的最优参数化动作指引无人机中继式导航。本发明在多阶段导航这类中继式任务中自主规划无人机路径,实现导航过程。

    一种基于自适应池化方式的图像分类方法

    公开(公告)号:CN115424076A

    公开(公告)日:2022-12-02

    申请号:CN202211131518.X

    申请日:2022-09-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于自适应池化方式的图像分类方法,将当前池化层的输入特征图按照池化层所给定的卷积核尺寸、步长和填充的大小,使用滑动窗口的方式分别展开为n个区域,每个区域分别对应有一个α值,采用自适应的方式,将特征图对应的n个区域经过采样后得到一系列t分布,再将其经过仿射变换后,结合当前的α值,动态地去调整α值的大小,进而就控制自适应池化动态的去改变输出特征点的选择,再将池化后的特征值折叠起来,就得到使用了不同程度的池化方式所对应的输出特征图。通过本发明,解决了传统图像分类中只能使用最大池化或者平均池化所带来的保留的信息不够准确等问题,从而能更好的利用的数据的实际情况,提高了模型分类的准确率。

    一种挠性高超声速飞行器分布式故障补偿方法

    公开(公告)号:CN115079574A

    公开(公告)日:2022-09-20

    申请号:CN202210844698.X

    申请日:2022-07-19

    Applicant: 安徽大学

    Inventor: 赵冬 任璐 吴巧云

    Abstract: 本发明公开了一种挠性高超声速飞行器分布式故障补偿控制方法,包括:根据飞行器的结构及飞行环境,采用T‑S模糊控制技术将常微分系统进行分段线性化;基于偏微分系统建立分布式故障下的挠性高超声速飞行器纵向动力学系统模型;构造可逆的状态变换,将分布式故障全部传递至偏微分系统的边界上,得到等价动力学系统模型;建立T‑S模糊容错控制框架,实现飞行器的状态在分布式故障下一致有界稳定;引入鲁棒性能指标,实现飞行器的状态在分布式故障下渐近稳定。本发明分布式故障补偿控制方法保证飞行器在发生分布式故障时,仍能够完成既定的飞行任务,提高了飞行器运行的可靠性及安全性。

    基于动作因果性评估的深度强化学习高效探索方法

    公开(公告)号:CN118886446A

    公开(公告)日:2024-11-01

    申请号:CN202411149185.2

    申请日:2024-08-21

    Applicant: 安徽大学

    Abstract: 本发明公开了基于动作因果性评估的深度强化学习高效探索方法,包括:第一阶段在不同的环境中,使用逆动态模型训练智能体的动作对环境的影响得到动作因果评估网络;根据动作因果评估网络,输入当前时刻状态和动作计算在每个动作对下一时刻环境状态变化的影响程度大小;设置一个阈值对智能体的动作进行筛选,得到智能体的最小动作空间和冗余动作空间;获取智能体环境信息,与最小动作空间共同输入深度强化学习模型,结合近端策略优化算法,输出智能体执行的动作并获取环境的反馈信息,直至训练结束;评估模型的性能,检查在不同的环境中是否收敛。本发明提出的方法兼顾高效性、灵活性和适应性,为智能体在复杂环境中的应用提供了有力支持。

    一种雾天场景下的海上小目标航拍图像识别模型训练方法

    公开(公告)号:CN117893879B

    公开(公告)日:2024-09-27

    申请号:CN202410078638.0

    申请日:2024-01-19

    Applicant: 安徽大学

    Abstract: 本发明公开了一种雾天场景下的海上小目标航拍图像识别模型训练方法,包括:结合现有的雾天成像模型,通过改变雾的厚度和亮度,对原始海上小目标航拍数据集进行加雾,模拟出各种场景下的雾天图像,建立雾天场景下的海上小目标航拍图像数据集;在YOLOv5网络结构模型的基础上设置小目标的检测层,构建雾天条件下的海上小目标航拍图像目标识别模型;基于WIOU以及Wasserstein距离的组合构建新的损失函数,不断调整WIOU以及Wasserstein距离的权重,并利用建立的数据集对模型进行训练。本发明解决了雾天场景下,海上小目标航拍图像识别模型的训练过程中出现的数据集缺乏、去雾效果差、检测精度低的问题,为准确、快速、稳定的雾天场景下海上小目标航拍图像检测模型训练奠定了基础。

    一种基于有偏选择池化的图像分类方法

    公开(公告)号:CN116630697B

    公开(公告)日:2024-04-05

    申请号:CN202310552011.X

    申请日:2023-05-17

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于有偏选择池化的图像分类方法,所述方法包括:数据预处理并定义模型,定义一组超参数[α1,α2,…,αk],初始化掩膜[β1,β2,…,βk]中的参数;定义优化器、损失函数和学习率衰减策略,设定包括学习率lr、迭代次数epoch、批量大小batch等超参数;将训练集送入模型,进行前向传播,图像经过卷积层提取局部特征。本发明通过调整超参数来实现不同的特征提取目标,解决了传统图像分类中使用最大池化或者平均池化所带来的保留的信息不够准确等问题,提高了图像分类的准确性,同时本发明相较于最大值池化和平均池化而言更加灵活,可以更好的适应各种不同的数据特征和任务。

    动态网络的有界簇同步方法、设备及存储介质

    公开(公告)号:CN117675594A

    公开(公告)日:2024-03-08

    申请号:CN202311692315.2

    申请日:2023-12-11

    Applicant: 安徽大学

    Abstract: 本发明的一种动态网络的有界簇同步方法、设备及存储介质,包括将具有有向切换拓扑的动态系统划分为若干个簇;设计每个代理与虚拟领导者之间的耦合控制器,使得代理能够跟踪虚拟领导者的期望轨迹;通过平均方法将原始的动态系统转化为一个平均系统,使得平均系统具有相同的簇结构和耦合控制器;分析平均系统的稳定性和收敛性,给出关于时间平均拓扑的簇内耦合强度的充分条件,保证有界簇同步的实现;当网络拓扑切换速度达到设定要求时,利用原始系统和平均系统之间的等价关系,将平均系统的簇同步结果推广到原始系统,实现有向切换拓扑动态系统的有界簇同步。本发明的技术方案是通过平均方法将簇同步问题转化为稳定性问题,并给出了收敛性条件。

Patent Agency Ranking