基于Q学习的深度神经网络自适应退避策略实现方法及系统

    公开(公告)号:CN111867139B

    公开(公告)日:2022-03-01

    申请号:CN202010640594.8

    申请日:2020-07-06

    Abstract: 本发明提供了一种基于Q学习的深度神经网络自适应退避策略实现方法及系统,包括:步骤1:对无人机网络中的网络节点和网络拓扑结构进行初始化,确定树形网络的簇头节点,对退避策略参数初始化后,广播至全网节点;步骤2:全网节点根据初始化后的退避策略参数来更新本地的退避策略;步骤3:簇头节点根据收到的更新信息进行统计,得出网络公平性指标并形成向量,保存进经验池中;步骤4:簇头节点从经验池中提取向量,输入到深度神经网络进行训练,得到真实Q值,将真实Q值与预测Q值进行对比;步骤5:返回步骤2继续执行,当学习策略趋于稳定符合预设条件时,输出退避策略。本发明提高了无人机节点在动态变化网络场景中的通信性能。

    基于Q学习的深度神经网络自适应退避策略实现方法及系统

    公开(公告)号:CN111867139A

    公开(公告)日:2020-10-30

    申请号:CN202010640594.8

    申请日:2020-07-06

    Abstract: 本发明提供了一种基于Q学习的深度神经网络自适应退避策略实现方法及系统,包括:步骤1:对无人机网络中的网络节点和网络拓扑结构进行初始化,确定树形网络的簇头节点,对退避策略参数初始化后,广播至全网节点;步骤2:全网节点根据初始化后的退避策略参数来更新本地的退避策略;步骤3:簇头节点根据收到的更新信息进行统计,得出网络公平性指标并形成向量,保存进经验池中;步骤4:簇头节点从经验池中提取向量,输入到深度神经网络进行训练,得到真实Q值,将真实Q值与预测Q值进行对比;步骤5:返回步骤2继续执行,当学习策略趋于稳定符合预设条件时,输出退避策略。本发明提高了无人机节点在动态变化网络场景中的通信性能。

    实现全局优化AODV路由的方法、系统及介质

    公开(公告)号:CN111614559A

    公开(公告)日:2020-09-01

    申请号:CN202010413894.2

    申请日:2020-05-15

    Abstract: 本发明提供了一种实现全局优化AODV路由的方法、系统及介质,包括发起节点Q表的更新过程和目的节点计算近似全局优化路由的过程;所述发起节点Q表的更新过程为:在发起节点中引入分布值函数优化Q值的更新策略,其中的权重参数由卡尔曼滤波结合高斯滤波算法通过建立轨迹预测模型计算得到,从而完成发起节点Q表的更新过程;所述目的节点计算近似全局优化路由的过程为:目的节点返回一定时间内缓存中平均Q值最大的路由给源节点。本发明提升了网络的鲁棒性和信息传输成功率,降低了网络端到端时延。

Patent Agency Ranking