一种基于脉冲分布式强化学习的无人机路径规划方法

    公开(公告)号:CN118913295B

    公开(公告)日:2025-01-10

    申请号:CN202411422856.8

    申请日:2024-10-12

    Abstract: 本发明公开了一种基于脉冲分布式强化学习的无人机路径规划方法,属于机器智能决策与控制技术领域。本发明方法包括构建基于脉冲神经网络的分布式强化学习神经网络模型,该模型在无人机路径规划过程中预测动作的回报分布而非传统的回报期望,根据回报分布捕捉更多有效信息以在面对复杂情景时更加稳定地选择高质量的无人机控制动作。本发明基于脉冲神经网络的模型架构降低了计算频率,基于分布式强化学习的方法弥补了现有无人机路径规划方法关注点单一、损失有价值信息的问题,增强了本发明应对不确定性和随机性的能力,扩大了本发明方法面对复杂多变的现实无人机路径规划任务时的适用性。

    一种基于模型拆分的分布式联邦学习通信压缩方案

    公开(公告)号:CN119172437A

    公开(公告)日:2024-12-20

    申请号:CN202411102287.9

    申请日:2024-08-12

    Abstract: 本发明涉及机器学习领域,尤其涉及一种基于模型拆分的分布式联邦学习通信压缩方案,旨在压缩参数更新过程中的模型参数矩阵来减少网络传输梯度通信量。本发明方案包括以下步骤:针对所预设的模型参数x,选择指定的边缘设备参与训练,并初始化数据和损失函数;对于步上一步骤中传输到边缘设备的参数,边缘设备使用其本地数据计算最新的模型参数矩阵;针对上一步骤中计算出来的模型参数矩阵,边缘设备使用模型拆分方法以及转化为三元组将其压缩。本发明用于分布式机器学习中联邦学习领域,能够在压缩网络传输比特量的情况下,实现深度神经网络的参数优化,同时能保持最终模型准确率与较低的通信轮次。

    基于两阶段解耦离线强化学习的机器人路径规划模型及方法

    公开(公告)号:CN119148702A

    公开(公告)日:2024-12-17

    申请号:CN202411100707.X

    申请日:2024-08-12

    Abstract: 本发明公开了一种基于两阶段解耦离线强化学习的机器人路径规划模型及方法,属于机器智能决策与控制技术领域。该方法包括一种基于两阶段解耦离线强化学习的神经网络模型,该模型利用Transformer架构避免传统基于策略约束方法和基于值函数正则方法存在的分布外泛化问题,并修改现有的基于Transformer架构强化学习方法,使预测状态与预测动作两阶段解耦,令智能体不局限于模仿数据集中轨迹与动作组合,而是能够学习到具有高期望回报的状态,通过拼接次优轨迹和状态组合实现超越数据集中最优轨迹的行为策略。该方法旨在解决现有机器人路径规划方法计算资源需求高,模型泛化能力差,模型应对不确定性和容易陷入局部最优等问题。

    一种基于脉冲分布式强化学习的无人机路径规划方法

    公开(公告)号:CN118913295A

    公开(公告)日:2024-11-08

    申请号:CN202411422856.8

    申请日:2024-10-12

    Abstract: 本发明公开了一种基于脉冲分布式强化学习的无人机路径规划方法,属于机器智能决策与控制技术领域。本发明方法包括构建基于脉冲神经网络的分布式强化学习神经网络模型,该模型在无人机路径规划过程中预测动作的回报分布而非传统的回报期望,根据回报分布捕捉更多有效信息以在面对复杂情景时更加稳定地选择高质量的无人机控制动作。本发明基于脉冲神经网络的模型架构降低了计算频率,基于分布式强化学习的方法弥补了现有无人机路径规划方法关注点单一、损失有价值信息的问题,增强了本发明应对不确定性和随机性的能力,扩大了本发明方法面对复杂多变的现实无人机路径规划任务时的适用性。

Patent Agency Ranking