-
公开(公告)号:CN119519884A
公开(公告)日:2025-02-25
申请号:CN202411521389.4
申请日:2024-10-29
Applicant: 南京理工大学
IPC: H04K3/00 , G05D1/695 , G05D1/46 , G05D109/20
Abstract: 本发明公开了一种基于元强化学习的无人机集群抗干扰通信方法,该方法为:构建无人机集群抗干扰通信环境,初始化网络参数,生成多个元强化学习任务;从元训练集抽样任务,初始化环境、经验池、上下文采样池;各无人机将与环境交互的观测数据输入至用于上下文任务推理的编码器和长短期记忆网络模块,得到上下文任务信息和历史记忆,将其与智能体的当前观测拼接,作为双深度递归Q网络即DDRQN的输入,预测动作并与环境交互;最后判断环境是否达到最大训练步长,若达到则结束当前回合,进入元测试阶段;否则重复进行下一轮的训练。本发明具有可扩展性强、泛化性能强、学习效率高、稳定性强、传输能量损耗低、跳频开销少、网络寿命长的优点。
-
公开(公告)号:CN115002816B
公开(公告)日:2025-02-07
申请号:CN202210389627.5
申请日:2022-04-14
Applicant: 南京理工大学
IPC: H04W24/06 , H04L43/0888 , H04L5/00 , G06N7/01
Abstract: 本发明提供了一种传输时限下ALOHA网络吞吐率的简单分析方法,包括确定马尔可夫过程相关参数,确定任一数据包成功传输的概率τ,进而确定传输时限下网络吞吐率。本发明旨在提供一种传输时限下ALOHA网络吞吐率的简单分析方法,以对传输时限和传输次数限制下ALOHA网络吞吐率分析提供帮助。
-
公开(公告)号:CN118488516A
公开(公告)日:2024-08-13
申请号:CN202410632927.0
申请日:2024-05-21
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于多智能体P‑DGN的无人集群联合跨层路由和功率分配方法,该方法为:初始化环境;将各个节点建模为智能体,建立分布式部分可观测马尔科夫模型;将各智能体的观测编码作为特征向量,采用图注意力卷积的方式对邻域内各智能体观测编码的特征向量进行聚合,得到新的隐特征向量;智能体将隐特征向量输入DDPG网络得到连续动作参数,将连续动作参数和隐特征向量一起输入到DGN网络得到动作价值函数Q值,根据贪婪策略选择离散动作和连续动作参数;计算到达下一跳节点的传输时延,计算即时奖励,转移至下一个状态并获得新的观测;重复以上步骤直至完成一次数据包传输任务,重置环境;采用经验回放和目标网络方法进行训练,直至系统平均奖励值收敛。本发明能够适应无人集群网络高速变化的拓扑结构、平均传输时延低、速度快、稳定性高。
-
公开(公告)号:CN115277845B
公开(公告)日:2024-07-19
申请号:CN202210867388.X
申请日:2022-07-22
Applicant: 南京理工大学
IPC: H04L67/568 , H04L67/12 , G06F17/18
Abstract: 本发明公开了一种基于多智能体近端策略的车联网分布式边缘缓存决策方法,具体为:输入车辆边缘网络环境,初始化执行者‑评估者网络参数;各车辆用户观测自身坐标及各边缘接入点剩余存储空间;各车辆用户根据策略选择边缘接入点,执行边缘缓存动作;各车辆用户计算时延相关奖励,根据广义优势估计方法计算回报与优势;根据收集的动作、观测和奖励信息,各车辆用户通过共享的策略网络进行集中式训练,以截断方法约束策略的更新,计算执行者‑评估者网络的损失函数且更新共享策略,实现分布式车联网边缘缓存决策。本发明使得车联网用户中每个车辆用户智能体能够充分利用自身观测信息,协同分配系统边缘缓存资源,从而降低缓存内容传输时延。
-
公开(公告)号:CN110311717B
公开(公告)日:2023-05-26
申请号:CN201910590329.0
申请日:2019-07-02
Applicant: 南京理工大学
IPC: H04B7/06 , H04B7/08 , H04B7/0456 , H04W16/28
Abstract: 本发明提供了混合模拟与数字结构发射机中,基于方向调制的稳健的混合波束成形设计方法。该方法需要在已知期望用户与窃听者角度信息和角度误差分布的情况下,分别设计模拟预编码、有用信号数字预编码和人工噪声数字预编码。首先利用相位对齐的思想设计模拟波束成形矩阵,并进一步考虑角度误差设计稳健的模拟波束成形。在模拟波束成形矩阵确定的情况下,通过最小化混合预编码与全数字预编码之间的欧几里得距离分别设计稳健的有用信号数字波束成形向量与人工噪声数字波束成形矩阵。为了提高系统的能效并降低设计复杂度,此处采用部分连接型的混合结构。本发明采用混合结构显著降低电路成本,安全速率性能与误码率性能都有显著提升。
-
公开(公告)号:CN109714778B
公开(公告)日:2022-11-22
申请号:CN201910144014.3
申请日:2019-02-27
Applicant: 南京理工大学
Abstract: 本发明提供了一种用于认知无线电网络的多选竞争解决方法,包括认知无线电网络中认知用户发生信道冲突时的系统模型和竞争解决方法;其特征在于:每个时隙被分为竞争窗口与数据通信窗口两部分。在每个时隙开始时,发生信道冲突的认知用户首先在竞争窗口进行相互竞争,赢取在数据窗口传输信息的权利。本发明可以减小认知无线电网络中认知用户之间因为信道冲突导致的交汇延迟或交汇失败,提高认知用户的竞争成功率。
-
公开(公告)号:CN113556287B
公开(公告)日:2022-10-14
申请号:CN202110663351.0
申请日:2021-06-15
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于多智能体强化学习的软件定义网络路由方法,该方法为:获取当前软件定义网络的参数,初始化各个节点的路由表和先验概率分布;当数据流到达各个节点时,各个节点根据∈贪心算法选择下一跳节点并转发数据流;各个节点完成数据流的转发后计算即时奖励,并且收到下一跳节点反馈的先验概率分布和路由表中的值;各个节点根据Soft Q‑learning算法更新自己的路由表和先验概率分布,并多次训练直到收敛,获得最优策略。本发明适用于软件定义网络中的路由问题,能有效加快路由表的收敛速度,减少网络延时,提高网络的抗干扰和抗攻击的能力。
-
公开(公告)号:CN114630299A
公开(公告)日:2022-06-14
申请号:CN202210228341.9
申请日:2022-03-08
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于深度强化学习的信息年龄可感知资源分配方法,具体为:输入车联网环境,基站初始化自身actor网络和critic网络的参数;在当前时隙中,基站先为环境中所有的车辆用户对分配信道和发射功率;车辆用户和蜂窝用户完成通信后,所有链路的剩余负载量和信息年龄更新;基站得到环境反馈的奖励后,感知并收集环境当前状态信息,同时缓冲池存储此时隙产生的样本数据;当样本数量足够时,根据置信域策略优化算法中的迭代公式来更新actor网络和critic网络的参数,更新完成后清空缓冲池;当达到训练回合的最大步数时,重新输入车联网环境开始下一回合。本发明通过最小化平均信息年龄和平均功耗来支持车联网中各类实时性敏感应用。
-
公开(公告)号:CN113613207A
公开(公告)日:2021-11-05
申请号:CN202010538089.2
申请日:2020-06-12
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于多智能体强化学习的车联网频谱共享方法,包括建立车联网系统模型,基于马尔科夫决策过程建立强化学习中观测空间、行为空间、奖励设定的基础模型,然后将系统模型中的车辆链路视为智能体,利用强化学习SAC(Soft Actor‑critic)思想设计频谱共享方法。本发明的设计方案能够以合作的方式实现车联网中车辆与车辆(Vehicle‑to‑Vehicle,V2V)链路和车联与路旁基础设施(Vehicle‑to‑Roadside Infrastructure,V2I)链路的频谱共享,保证最大化V2I链路的信道容量和性能和V2V链路载荷的成功传输概率性能。
-
公开(公告)号:CN113572548A
公开(公告)日:2021-10-29
申请号:CN202110680187.4
申请日:2021-06-18
Applicant: 南京理工大学
IPC: H04B17/318 , H04B17/345 , H04B17/391 , H04B1/715 , H04W84/18
Abstract: 本发明公开了一种基于多智能体强化学习的无人机网络协同快跳频方法,具体为:输入无人机网络环境,每对无人机初始化自身Q表以及最优先验动作分布估计、互信息惩罚项系数和动作状态对出现次数;在当前时隙中,每对无人机根据上一时隙生成的动作选择传输信道,传输完成后得到环境反馈的奖励;每对无人机观测环境的当前状态,再与其它无人机对交互当前状态下各个动作的Q值得到全局Q值,根据互信息正则化soft Q‑learning算法中的行为策略生成动作;每对无人机更新自身Q表以及各个参量;当达到训练回合的最大步数时,重新输入无人机网络环境开始下一回合。本发明实现了所有无人机对的总吞吐量性能的提升,为无人机网络提供了通信保障。
-
-
-
-
-
-
-
-
-