一种基于模仿学习的群体无人机自主运动规划方法

    公开(公告)号:CN115164890B

    公开(公告)日:2025-04-01

    申请号:CN202210651734.0

    申请日:2022-06-09

    Applicant: 复旦大学

    Abstract: 本发明涉及一种基于模仿学习的群体无人机自主运动规划方法,该方法包括:构建专家系统:获取用于模仿学习的数据集,包括实时环境感知、无人机自身状态、群体中其他无人机信息、无人机自身实时预测轨迹;构建学生系统:包括通过模仿学习进行无人机轨迹预测的神经网络推理模块,神经网络推理模块通过专家系统获取的数据集进行训练;对群体中的每个无人机分别配置训练过的学生系统,通过学生系统进行无人机轨迹预测,完成自主运动规划。与现有技术相比,本发明采用了模仿学习,无需设计有限状态机决策过程,完全依靠神经网络的学习进行决策,融合了自主规划与决策过程,节约了时间。

    应用于机械臂控制的视觉强化学习测试时适应方法

    公开(公告)号:CN118003329A

    公开(公告)日:2024-05-10

    申请号:CN202410303260.X

    申请日:2024-03-18

    Applicant: 复旦大学

    Abstract: 本发明涉及一种应用于机械臂控制的视觉强化学习测试时适应方法,包括:S1、获取经过训练的用于机械臂控制的智能体;S2、将智能体置于实际环境中作为当前智能体,并构建知识库;S3、当前智能体从实际环境中获取当前图像,当前图像存入知识库中,智能体输出当前动作;S4、判断知识库中的图像是否达到批次阈值,若否,则返回S3,反之,进行前向传播,更新当前智能体的各个批归一化层;S5、重复S3~S4,得到各个批归一化层的结果均值和结果方差;S6、将结果均值和结果方差与均值和方差的初始值进行混合,得到混合均值和混合方差。与现有技术相比,本发明具有提高强化学习的环境适用性等优点。

    应用于机械臂控制的视觉强化学习测试时适应方法

    公开(公告)号:CN118003329B

    公开(公告)日:2024-09-06

    申请号:CN202410303260.X

    申请日:2024-03-18

    Applicant: 复旦大学

    Abstract: 本发明涉及一种应用于机械臂控制的视觉强化学习测试时适应方法,包括:S1、获取经过训练的用于机械臂控制的智能体;S2、将智能体置于实际环境中作为当前智能体,并构建知识库;S3、当前智能体从实际环境中获取当前图像,当前图像存入知识库中,智能体输出当前动作;S4、判断知识库中的图像是否达到批次阈值,若否,则返回S3,反之,进行前向传播,更新当前智能体的各个批归一化层;S5、重复S3~S4,得到各个批归一化层的结果均值和结果方差;S6、将结果均值和结果方差与均值和方差的初始值进行混合,得到混合均值和混合方差。与现有技术相比,本发明具有提高强化学习的环境适用性等优点。

    利用中层视觉先验的强化学习路径规划方法

    公开(公告)号:CN117408127A

    公开(公告)日:2024-01-16

    申请号:CN202310177338.3

    申请日:2023-02-28

    Applicant: 复旦大学

    Abstract: 本发明提供了一种利用中层视觉先验的强化学习路径规划方法,具有这样的特征,包括以下步骤:步骤S1,将图像数据输入视觉处理网络得到中层特征信息;步骤S2,将中层特征信息向量化为向量信息D;步骤S3,对坐标进行转化;步骤S4,将向量信息D、当前位置坐标Q’和目标点坐标T’输入决策模型,得到下一个路径点P’;步骤S5,将下一个路径点P’作为当前位置坐标Q’,迭代执行步骤S4,得到可跟随路径L;步骤S6,控制机器人根据可跟随路径L移动,t时间后重新采集图像数据;步骤S7,重复执行步骤S1至步骤S6,直至控制机器人移动至目标点。总之,本方法能够利用感知信息控制机器人进行更有效的导航移动。

    一种基于模仿学习的群体无人机自主运动规划方法

    公开(公告)号:CN115164890A

    公开(公告)日:2022-10-11

    申请号:CN202210651734.0

    申请日:2022-06-09

    Applicant: 复旦大学

    Abstract: 本发明涉及一种基于模仿学习的群体无人机自主运动规划方法,该方法包括:构建专家系统:获取用于模仿学习的数据集,包括实时环境感知、无人机自身状态、群体中其他无人机信息、无人机自身实时预测轨迹;构建学生系统:包括通过模仿学习进行无人机轨迹预测的神经网络推理模块,神经网络推理模块通过专家系统获取的数据集进行训练;对群体中的每个无人机分别配置训练过的学生系统,通过学生系统进行无人机轨迹预测,完成自主运动规划。与现有技术相比,本发明采用了模仿学习,无需设计有限状态机决策过程,完全依靠神经网络的学习进行决策,融合了自主规划与决策过程,节约了时间。

    基于模仿学习的单体无人机自主运动规划方法

    公开(公告)号:CN116481532A

    公开(公告)日:2023-07-25

    申请号:CN202211315393.6

    申请日:2022-10-26

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于模仿学习的单体无人机自主运动规划方法。构建一个仿真环境并在仿真环境中基于现实无人机构建相应的虚拟无人机模型,包括以下步骤:步骤S1,基于仿真环境获得虚拟无人机进行轨迹规划的训练样本;步骤S2,通过训练样本训练现实无人机的神经网络;步骤S3,通过现实无人机的传感器,采集实时环境感知数据和现实无人机自身状态数据;步骤S4,结合目标点数据采用神经网络基于实时环境感知数据和现实无人机自身状态数据生成实时预测轨迹点序列;步骤S5,将实时预测轨迹点序列转化为控制量;步骤S6,控制现实无人机根据控制量进行自主运动。本方法能够很好的兼顾避障成功率和无人机飞行速度,具有极大的应用前景。

Patent Agency Ranking