一种基于强化学习的无人机网络发射功率分配方法及装置

    公开(公告)号:CN113316239A

    公开(公告)日:2021-08-27

    申请号:CN202110505367.9

    申请日:2021-05-10

    Abstract: 本发明公开了一种基于强化学习的无人机网络发射功率分配方法及装置,所述方法包括:初始化无人机以及用户的状态,定义动作空间以及神经网络的参数;初始化价值函数和当前网络状态的Q值;与环境交互接收奖励反馈并计算采取当前动作的Q值;根据反馈得到的奖励的最大值选取最优动作;更新系统的下一状态并存储至经验池中;判断经验数量是否达到预期值,若达到则开始进行深度强化学习,若未达到则继续循环;根据贝尔曼方程得到即时奖励并采取DPPO算法进行深度学习,以长期奖励函数最大化为目标进行强化学习;判断长期奖励函数的值是否趋于收敛,当趋于收敛时终止学习,此时已完成无人机无线自组网的资源分配最优化。

    一种基于轻量化CNN的DAS管道流量监测方法

    公开(公告)号:CN120043592A

    公开(公告)日:2025-05-27

    申请号:CN202510166936.X

    申请日:2025-02-14

    Abstract: 本发明公开了一种基于轻量化CNN的DAS管道流量监测方法,属于管道流量监测技术领域,所述方法包括:使用DAS系统采集管道DAS数据并记录管道流量值,构建样本数据集;构建轻量化的管道流量监测模型;利用样本数据集对管道流量监测模型进行训练;基于训练好的管道流量监测模型实现管道流量监测。本发明的技术方案通过创新的网络架构设计、先进的训练策略、高效的后处理算法,使用训练好的模型对管道流量进行监测,可以快速精确地预测管道流量值。

    一种基于强化学习的无人机网络发射功率分配方法及装置

    公开(公告)号:CN113316239B

    公开(公告)日:2022-07-08

    申请号:CN202110505367.9

    申请日:2021-05-10

    Abstract: 本发明公开了一种基于强化学习的无人机网络发射功率分配方法及装置,所述方法包括:初始化无人机以及用户的状态,定义动作空间以及神经网络的参数;初始化价值函数和当前网络状态的Q值;与环境交互接收奖励反馈并计算采取当前动作的Q值;根据反馈得到的奖励的最大值选取最优动作;更新系统的下一状态并存储至经验池中;判断经验数量是否达到预期值,若达到则开始进行深度强化学习,若未达到则继续循环;根据贝尔曼方程得到即时奖励并采取DPPO算法进行深度学习,以长期奖励函数最大化为目标进行强化学习;判断长期奖励函数的值是否趋于收敛,当趋于收敛时终止学习,此时已完成无人机无线自组网的资源分配最优化。

Patent Agency Ranking