一种基于ST-Swin-T神经网络面向无人机自主着陆的场景图识别方法

    公开(公告)号:CN118447341A

    公开(公告)日:2024-08-06

    申请号:CN202410906142.8

    申请日:2024-07-08

    Applicant: 安徽大学

    Abstract: 本发明涉及无人机着陆识别技术领域,解决了传统方法无法适用于无人机面向紧急情况下实现自主着陆的技术问题,尤其涉及一种基于ST‑Swin‑T神经网络面向无人机自主着陆的场景图识别方法,包括:构建针对无人机着陆场景的数据集,并根据若干着陆场景类别将数据集分为多个安全等级;基于Swin‑T神经网络的骨干网络构建用于对无人机着陆的着陆场景图进行分类识别的识别模型ST‑Swin‑T;基于预训练模型对识别模型ST‑Swin‑T进行训练。本发明能够在面对紧急着陆场景时,通过直接检测下方的图像来判断能否降落,无需复杂计算或精确降落于特定点。并且显著提升了无人机的飞行安全性,同时为其自主学习识别着陆场景奠定了基础。

    一种基于强化学习的任意角度倒立摆模型训练方法

    公开(公告)号:CN117313826B

    公开(公告)日:2024-02-23

    申请号:CN202311615603.8

    申请日:2023-11-30

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于强化学习的任意角度倒立摆模型训练方法,包括:获得小车一阶倒立摆状态向量;获得环境返回的值函数数组;计算下一状态的状态向量,返回执行本次动作所获得的奖励和一个判断环境是否结束的结束标识;将当前状态、下一状态、奖励、结束标识、所选动作作为一个元组存入到经验回放池中;从经验回放池中随机抽取一批元组;根据时序差分算法,计算损失函数,并更新神经网络,使得损失减小,直到通过结束标识判断出环境结束,完成网络模型训练,并通过训练好的模型来训练不同角度的模型。本发明考虑到不同角度训练的异同,把角度作为神经网络输入元素的一部分,使模型可以根据不同角度给出不同的动作选择,使训练更灵(56)对比文件王红睿;赵黎明.基于增强学习规则的倒立摆模糊神经网络控制器.吉林大学学报(信息科学版).2006,(05),全文.

    一种基于统一AI框架的深度强化学习智能决策平台

    公开(公告)号:CN117114088B

    公开(公告)日:2024-01-19

    申请号:CN202311338634.3

    申请日:2023-10-17

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于统一AI框架的深度强化学习智能决策平台,通过参数配置模块选定深度强化学习模型的参数,利用通用模块对选定的参数进行读取,根据读取到的参数,从模型库中调取并创建相应的表征器、策略模块、学习器以及智能体,在创建策略和学习器的过程中,从数学工具中调取必要的函数定义以及优化器;同时,根据读取到的参数,在原始环境基础上创建向量环境,并实例化环境,将实例化环境和智能体输入运行器中计算动作输出,并在环境中执行动作,实现智能决策。该智能决策平台对不同功能和结构的深度强化学习模型进行模块化设计,从而兼容多种AI框架。

    一种基于深度强化学习和PID控制器的无人机导航方法

    公开(公告)号:CN117387635A

    公开(公告)日:2024-01-12

    申请号:CN202311707956.0

    申请日:2023-12-13

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于深度强化学习和PID控制器的无人机导航方法,包括:获取无人机执行导航任务时的无人机状态向量;构建深度强化学习网络,将无人机状态向量输入深度强化学习网络中获取原始经验并将原始经验存储进原始经验存储池中;将原始经验存储池中的原始经验输入经验扩展模块得到扩展经验,利用扩展经验更新深度强化学习网络得到训练后的深度强化学习模型;重新获取无人机状态向量,输入到训练后的深度强化学习网络中,输出控制命令指引无人机完成导航。本发明在包含真实动力学的无人机导航任务中高效规划无人机路径,并使用PID控制器控制高仿真无人机飞行,最终使无人机沿着高效路径安全、平稳、无碰撞地到达目标区域,实现避障导航全过程。

    一种基于强化学习的任意角度倒立摆模型训练方法

    公开(公告)号:CN117313826A

    公开(公告)日:2023-12-29

    申请号:CN202311615603.8

    申请日:2023-11-30

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于强化学习的任意角度倒立摆模型训练方法,包括:获得小车一阶倒立摆状态向量;获得环境返回的值函数数组;计算下一状态的状态向量,返回执行本次动作所获得的奖励和一个判断环境是否结束的结束标识;将当前状态、下一状态、奖励、结束标识、所选动作作为一个元组存入到经验回放池中;从经验回放池中随机抽取一批元组;根据时序差分算法,计算损失函数,并更新神经网络,使得损失减小,直到通过结束标识判断出环境结束,完成网络模型训练,并通过训练好的模型来训练不同角度的模型。本发明考虑到不同角度训练的异同,把角度作为神经网络输入元素的一部分,使模型可以根据不同角度给出不同的动作选择,使训练更灵活、更通用。

Patent Agency Ranking