一种基于联邦强化学习的车联网边缘内容缓存决策方法

    公开(公告)号:CN116156455A

    公开(公告)日:2023-05-23

    申请号:CN202211708649.X

    申请日:2022-12-29

    Abstract: 本发明公开了一种基于联邦强化学习的车联网边缘内容缓存决策方法,具体为:输入车联网环境,初始化各车辆的网络参数;在当前时隙,各车辆与路侧单元交互以获得观测信息;根据观测信息,各车辆独立决策动作;执行完动作后,各车辆获得环境反馈的奖励,并将样本数据缓存至经验复用池;当样本数量足够时,各车辆根据柔性演员‑评论家算法更新网络;聚合中心收集本地网络参数进行联邦聚合,并将聚合参数广播至本地以训练;当前训练结束后,重置车联网环境,开始下一回合的训练。本发明旨在车联网环境下,利用以用户为中心的网络架构,使得车辆在隐私保护的前提下完成边缘缓存分布式决策,实现系统内容传输时延以及边缘缓存开销权衡的最小化。

    一种基于部分可观测信息的无人机集群多智能体多域抗干扰方法

    公开(公告)号:CN115454141A

    公开(公告)日:2022-12-09

    申请号:CN202211261459.8

    申请日:2022-10-14

    Abstract: 本发明公开了一种基于部分可观测信息的无人机集群多智能体多域抗干扰方法,该方法利用各智能体的部分观测环境信息,通过长短期记忆网络保留历史经验数据,输入各智能体的深度循环Q网络进行动作值函数拟合,采用ε‑greedy算法选择最大输出Q值对应的信道和功率,再经过不断独立训练各智能体的深度循环Q网络,更新Q值分布,最终学习到可适应未知干扰场景下实现通信传输能耗最小化的无人机信道和发射功率最优决策。本发明针对无人机集群网络分别处于扫频干扰和马尔科夫干扰两种场景下,利用部分可观测信息的历史经验数据,从频谱域和功率域实现有效多智能体抗干扰通信;相较于基于多智能体深度Q学习的对比方案,所提方案能够在环境信息部分可观测的情况下更高效地降低无人机集群网络的长期通信传输能耗。

    一种用于免授权接入的新型协议序列集构造方法

    公开(公告)号:CN115379502A

    公开(公告)日:2022-11-22

    申请号:CN202210638396.7

    申请日:2022-06-08

    Abstract: 本发明公开了一种用于免授权接入的新型协议序列集构造方法,包括基于CRT序列集的任一序列构造初选新序列集,选取初选新序列集中与其它序列最大汉明互相关之和最小的初选新序列构成备选新序列集,选择备选新序列集中最小均匀度序列替换当前序列,基于以上过程以迭代方式构造符合目标码重要求的新型协议序列集。本发明可以针对任意总设备数构造较高码重、较低汉明互相关以及较低序列均匀度的新型协议序列集,能够为各设备提供具有合理次数且平均分布的发送时机,从而降低平均时延,相较于其它免授权接入方案具有更优的时延性能。

    一种最佳稳定性的认知无线电交汇序列构造方法

    公开(公告)号:CN109302707B

    公开(公告)日:2022-11-22

    申请号:CN201811481490.6

    申请日:2018-12-05

    Abstract: 本发明提供了一种最佳稳定性的认知无线电交汇序列构造方法,包括认知无线电网络中认知用户信道跳转序列的构造方法和实现信道交汇的系统模型;认知用户按照各自生成的序列在可用信道上跳转,当两个或多个认知用户在同一时隙跳转到同一信道并且此信道没有被授权用户占用时,认知用户之间通过竞争赢得发送信息的权利,若有用户竞争胜利,完成数据传送,则信道交汇成功。本发明可以减小认知无线电网络中认知用户的交汇成功率方差,相较于其他交汇算法能达到最佳的交汇稳定性能。

    基于联邦多智能体强化学习的车联网边缘资源分配方法

    公开(公告)号:CN114980123A

    公开(公告)日:2022-08-30

    申请号:CN202210395450.X

    申请日:2022-04-15

    Abstract: 本发明公开了一种基于联邦多智能体强化学习的车联网边缘资源分配方法,具体为:输入车联网环境,初始化智能体本地Q网络和联邦网络参数,并对优化问题建模;根据智能体能否获得奖励分为α、β两类,在当前时隙内两类车辆智能体分别观测本地状态并输入Q网络的;对Q网络输出进行加密处理,并通过联邦网络输出两类车辆智能体的联合动作决策;之后α车辆智能体得到系统反馈的全局奖励,同时缓存池存储当前时隙的样本数据;当样本数量足够时,α型和β型车辆智能体分别更新本地Q网络以及联邦网络的参数;当前训练回合结束后,重置车联网环境,开始下一个回合的训练。本发明在隐私保护的前提下提升了车联网连通性,同时降低了切换开销以及能量损耗。

    基于多智能体协作的无人机集群网络智能多跳路由方法

    公开(公告)号:CN114499648A

    公开(公告)日:2022-05-13

    申请号:CN202210240571.7

    申请日:2022-03-10

    Abstract: 本发明公开了一种基于多智能体协作的无人机集群网络智能多跳路由方法,该方法为:无人机节点采用∈贪婪策略选择中继节点,在网络环境部分可观测的场景下实现最佳路由选择;同时在基于对邻居节点队列与位置信息观测下,运用协同多智能体价值分解网络方法,通过计算联合价值函数的时间差分误差以更新单个无人机节点的评估网络参数,最终学习到无人机节点路由策略并智能地选择中继节点,最大程度上降低传输时延。本发明针对无人机集群网络中的高动态拓扑特点,通过无人机之间的协同认知能力在最短路径基础上绕开高负载节点,实现智能路由选择;相较于传统独立Q学习能够学习到更优的路由策略,有效地降低了无人机在复杂变化环境下的通信传输时延。

    一种时限约束下的能量收集认知无线电网络接入方法

    公开(公告)号:CN114172599A

    公开(公告)日:2022-03-11

    申请号:CN202111530900.3

    申请日:2021-12-15

    Abstract: 本发明提供了一种时限约束下的能量收集认知无线电网络接入方法,包括确定部分观测马尔可夫决策过程的相关参数,确定次用户吞吐率指标,进而利用Q函数马尔可夫决策过程(Q‑functions Markov Decision Process,QMDP)算法确定感知接入动作。本发明旨在提供一种时限约束下的能量收集认知无线电网络接入方法,以对固定传输时限约束下多信道能量收集认知无线电网络中次用户的感知接入策略进行优化,提高了通信场景下传输的吞吐率。

    一种认知无线电网络的动态信道接入方法

    公开(公告)号:CN113613341A

    公开(公告)日:2021-11-05

    申请号:CN202010537350.7

    申请日:2020-06-12

    Abstract: 本发明公开了一种认知无线电网络的动态接入方法,包括确定马尔可夫决策过程的相关参数,确定传输时限下认知无线电网络的可靠性指标,进而根据最优接入概率得到近优可靠性。本发明对不同传输时限下等待数据发送的次用户数量不断变化的认知无线电网络的可靠性指标提出了一种启发式性能优化策略,为传输时限下认知无线电网络的有效实施提供帮助。

Patent Agency Ranking