一种基于强化学习算法的认知抗干扰通信方法

    公开(公告)号:CN109639374B

    公开(公告)日:2021-05-14

    申请号:CN201811653498.6

    申请日:2018-12-29

    Inventor: 黎海涛 罗佳伟

    Abstract: 本发明公开了一种基于强化学习算法的认知抗干扰通信方法。首先,利用频谱感知获得无干扰的信道和功率,形成由不同频率信道和发射功率组合的子集,并标记各个子集的索引值,所有这些子集构成候选资源集合;然后,在初始时刻,每一个节点遍历所有子集,计算节点对于每个子集的度量值,得到节点所对应的所有子集度量值的集合;再次,节点从对应度量值的集合中选择最大度量值所对应的一个子集,更新该子集对应的度量值;最后,在时间范围T内迭代计算度量值,其中最大度量值对应的子集即可使节点吞吐量最大化。本发明利用强化学习算法学习到最优策略,各个节点进行独立调整信道选择和功率分配,使抗干扰通信系统吞吐量最大化,达到抗干扰的目的。

    一种基于无状态Q学习的无线网络分布式自主资源分配方法

    公开(公告)号:CN108112082B

    公开(公告)日:2021-05-25

    申请号:CN201711366713.X

    申请日:2017-12-18

    Abstract: 本发明公开了一种基于无状态Q学习的无线网络分布式自主资源分配方法,首先把信道数和发射功率作为一组动作,随机选择一组动作,计算出实际网络吞吐量;然后把实际网络吞吐量和理论吞吐量的比值作为动作选择后的奖赏,并据此奖赏更新动作值函数;最后,迭代调整动作可以寻找到累计奖赏值函数最大解,其相应的动作即可达到无线网络的最优性能。本发明提出的方法能够在未知网内其他节点资源配置等先验信息的条件下,各个节点自主进行信道分配和发射功率控制使网络吞吐量最大化。

    一种基于强化学习算法的认知抗干扰通信方法

    公开(公告)号:CN109639374A

    公开(公告)日:2019-04-16

    申请号:CN201811653498.6

    申请日:2018-12-29

    Inventor: 黎海涛 罗佳伟

    Abstract: 本发明公开了一种基于强化学习算法的认知抗干扰通信方法。首先,利用频谱感知获得无干扰的信道和功率,形成由不同频率信道和发射功率组合的子集,并标记各个子集的索引值,所有这些子集构成候选资源集合;然后,在初始时刻,每一个节点遍历所有子集,计算节点对于每个子集的度量值,得到节点所对应的所有子集度量值的集合;再次,节点从对应度量值的集合中选择最大度量值所对应的一个子集,更新该子集对应的度量值;最后,在时间范围T内迭代计算度量值,其中最大度量值对应的子集即可使节点吞吐量最大化。本发明利用强化学习算法学习到最优策略,各个节点进行独立调整信道选择和功率分配,使抗干扰通信系统吞吐量最大化,达到抗干扰的目的。

    一种基于无状态Q学习的无线网络分布式自主资源分配方法

    公开(公告)号:CN108112082A

    公开(公告)日:2018-06-01

    申请号:CN201711366713.X

    申请日:2017-12-18

    Abstract: 本发明公开了一种基于无状态Q学习的无线网络分布式自主资源分配方法,首先把信道数和发射功率作为一组动作,随机选择一组动作,计算出实际网络吞吐量;然后把实际网络吞吐量和理论吞吐量的比值作为动作选择后的奖赏,并据此奖赏更新动作值函数;最后,迭代调整动作可以寻找到累计奖赏值函数最大解,其相应的动作即可达到无线网络的最优性能。本发明提出的方法能够在未知网内其他节点资源配置等先验信息的条件下,各个节点自主进行信道分配和发射功率控制使网络吞吐量最大化。

Patent Agency Ranking