-
公开(公告)号:CN113596785A
公开(公告)日:2021-11-02
申请号:CN202110843838.7
申请日:2021-07-26
Applicant: 吉林大学
Abstract: 本发明适用于通信技术领域,提供了基于深度Q网络的D2D‑NOMA通信系统资源分配方法,所述基于深度Q网络的D2D‑NOMA通信系统资源分配方法包括以下步骤:建立蜂窝网络下D2D‑NOMA通信系统的网络模型;计算蜂窝用户i被D2D‑NOMA簇复用后的信干噪比以及第j个簇内第k个D2D接收机的信干噪比构建以最大化D2D用户总吞吐量为目标的优化问题;建立马尔科夫模型;设计深度Q网络中的Behavior网络和Target网络;利用深度Q网络使智能体与环境交互,输出最优资源分配策略。本发明利用深度Q网络方法在保证蜂窝用户的服务质量的前提下,提高了D2D‑NOMA系统的吞吐量和频谱效率。
-
公开(公告)号:CN113784410A
公开(公告)日:2021-12-10
申请号:CN202111120444.5
申请日:2021-09-24
Applicant: 吉林大学
Abstract: 本发明专利公开了基于强化学习TD3算法的异构无线网络垂直切换方法,具体涉及通讯技术领域。包括如下步骤:采用熵权法计算网络状态参数的权重,构造奖励函数;初始化策略网络以及两个估计网络,对上述网络对应的目标网络初始化,并初始化经验池;演员当前网络根据网络状态参数做出切换决策,求得奖励值;采用梯度下降法训练评论家当前网络,采用梯度上升法训练演员当前网络,更新演员目标网络参数和评论家目标网络参数;在每个决策时刻进行S4‑S5的操作步骤,训练更新网络参数;根据训练好的策略网络来确定最优的切换策略。采用本发明技术方案解决了深度强化学习汇总网络参数状态动作值过高估计的问题,可用于快速选出最优切换决策。
-
公开(公告)号:CN113573284A
公开(公告)日:2021-10-29
申请号:CN202110685469.3
申请日:2021-06-21
Applicant: 吉林大学
Abstract: 本发明属于物联网通信技术领域,公开了大规模机器类通信基于机器学习的随机接入退避方法,包括S1:动态划分虚拟小小区,对MTCD业务分类;S2:针对退避接入问题建立马尔可夫决策过程;S3:获取MTCD服务质量参数,构建奖励函数;S4:构建评价网络Critic和策略网络Actor;S5:利用策略网络Actor生成退避接入决策;S6:最小化TD误差,更新评价网络Critic神经网络参数,并将TD误差传递给策略网络Actor;S7:获取TD误差作为优势函数更新策略网络Actor的神经网络参数,调整策略以改进回报;S8:进行N次循环迭代,训练更新网络参数;S9:为MTCD选择最优的退避接入时隙;本发明解决了现有技术MTCD随机接入网络所造成的网络拥塞问题,适用于MTCD随机接入网络。
-
公开(公告)号:CN113573284B
公开(公告)日:2023-05-12
申请号:CN202110685469.3
申请日:2021-06-21
Applicant: 吉林大学
Abstract: 本发明属于物联网通信技术领域,公开了大规模机器类通信基于机器学习的随机接入退避方法,包括S1:动态划分虚拟小小区,对MTCD业务分类;S2:针对退避接入问题建立马尔可夫决策过程;S3:获取MTCD服务质量参数,构建奖励函数;S4:构建评价网络Critic和策略网络Actor;S5:利用策略网络Actor生成退避接入决策;S6:最小化TD误差,更新评价网络Critic神经网络参数,并将TD误差传递给策略网络Actor;S7:获取TD误差作为优势函数更新策略网络Actor的神经网络参数,调整策略以改进回报;S8:进行N次循环迭代,训练更新网络参数;S9:为MTCD选择最优的退避接入时隙;本发明解决了现有技术MTCD随机接入网络所造成的网络拥塞问题,适用于MTCD随机接入网络。
-
公开(公告)号:CN113612843B
公开(公告)日:2022-08-30
申请号:CN202110882738.5
申请日:2021-08-02
Applicant: 吉林大学
IPC: H04L67/10 , H04L41/0894 , H04L41/14 , H04L47/78 , G06N20/00
Abstract: 本发明公开的属于通信技术领域,具体为一种基于深度强化学习的MEC任务卸载和资源分配方法,包括以下步骤:S1:在移动边缘计算场景下,构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型,并初始化系统参数;S2:针对三层的卸载场景,计算系统总体开销;S3:以最小化系统开销为优化目标,构建深度强化学习模型;S4:提出一种基于最大熵框架的柔性制动策略,进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法,在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。
-
公开(公告)号:CN113784410B
公开(公告)日:2022-09-23
申请号:CN202111120444.5
申请日:2021-09-24
Applicant: 吉林大学
Abstract: 本发明专利公开了基于强化学习TD3算法的异构无线网络垂直切换方法,具体涉及通讯技术领域。包括如下步骤:采用熵权法计算网络状态参数的权重,构造奖励函数;初始化策略网络以及两个估计网络,对上述网络对应的目标网络初始化,并初始化经验池;演员当前网络根据网络状态参数做出切换决策,求得奖励值;采用梯度下降法训练评论家当前网络,采用梯度上升法训练演员当前网络,更新演员目标网络参数和评论家目标网络参数;在每个决策时刻进行S4‑S5的操作步骤,训练更新网络参数;根据训练好的策略网络来确定最优的切换策略。采用本发明技术方案解决了深度强化学习汇总网络参数状态动作值过高估计的问题,可用于快速选出最优切换决策。
-
公开(公告)号:CN113612843A
公开(公告)日:2021-11-05
申请号:CN202110882738.5
申请日:2021-08-02
Applicant: 吉林大学
IPC: H04L29/08 , H04L12/911 , H04L12/24 , G06N20/00
Abstract: 本发明公开的属于通信技术领域,具体为一种基于深度强化学习的MEC任务卸载和资源分配方法,包括以下步骤:S1:在移动边缘计算场景下,构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型,并初始化系统参数;S2:针对三层的卸载场景,计算系统总体开销;S3:以最小化系统开销为优化目标,构建深度强化学习模型;S4:提出一种基于最大熵框架的柔性制动策略,进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法,在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。
-
-
-
-
-
-