基于强化学习TD3算法的异构无线网络垂直切换方法

    公开(公告)号:CN113784410B

    公开(公告)日:2022-09-23

    申请号:CN202111120444.5

    申请日:2021-09-24

    Applicant: 吉林大学

    Abstract: 本发明专利公开了基于强化学习TD3算法的异构无线网络垂直切换方法,具体涉及通讯技术领域。包括如下步骤:采用熵权法计算网络状态参数的权重,构造奖励函数;初始化策略网络以及两个估计网络,对上述网络对应的目标网络初始化,并初始化经验池;演员当前网络根据网络状态参数做出切换决策,求得奖励值;采用梯度下降法训练评论家当前网络,采用梯度上升法训练演员当前网络,更新演员目标网络参数和评论家目标网络参数;在每个决策时刻进行S4‑S5的操作步骤,训练更新网络参数;根据训练好的策略网络来确定最优的切换策略。采用本发明技术方案解决了深度强化学习汇总网络参数状态动作值过高估计的问题,可用于快速选出最优切换决策。

    一种基于深度强化学习的MEC任务卸载和资源分配方法

    公开(公告)号:CN113612843A

    公开(公告)日:2021-11-05

    申请号:CN202110882738.5

    申请日:2021-08-02

    Applicant: 吉林大学

    Abstract: 本发明公开的属于通信技术领域,具体为一种基于深度强化学习的MEC任务卸载和资源分配方法,包括以下步骤:S1:在移动边缘计算场景下,构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型,并初始化系统参数;S2:针对三层的卸载场景,计算系统总体开销;S3:以最小化系统开销为优化目标,构建深度强化学习模型;S4:提出一种基于最大熵框架的柔性制动策略,进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法,在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。

    基于深度Q网络的D2D-NOMA通信系统资源分配方法

    公开(公告)号:CN113596785A

    公开(公告)日:2021-11-02

    申请号:CN202110843838.7

    申请日:2021-07-26

    Applicant: 吉林大学

    Abstract: 本发明适用于通信技术领域,提供了基于深度Q网络的D2D‑NOMA通信系统资源分配方法,所述基于深度Q网络的D2D‑NOMA通信系统资源分配方法包括以下步骤:建立蜂窝网络下D2D‑NOMA通信系统的网络模型;计算蜂窝用户i被D2D‑NOMA簇复用后的信干噪比以及第j个簇内第k个D2D接收机的信干噪比构建以最大化D2D用户总吞吐量为目标的优化问题;建立马尔科夫模型;设计深度Q网络中的Behavior网络和Target网络;利用深度Q网络使智能体与环境交互,输出最优资源分配策略。本发明利用深度Q网络方法在保证蜂窝用户的服务质量的前提下,提高了D2D‑NOMA系统的吞吐量和频谱效率。

    一种基于深度强化学习的MEC任务卸载和资源分配方法

    公开(公告)号:CN113612843B

    公开(公告)日:2022-08-30

    申请号:CN202110882738.5

    申请日:2021-08-02

    Applicant: 吉林大学

    Abstract: 本发明公开的属于通信技术领域,具体为一种基于深度强化学习的MEC任务卸载和资源分配方法,包括以下步骤:S1:在移动边缘计算场景下,构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型,并初始化系统参数;S2:针对三层的卸载场景,计算系统总体开销;S3:以最小化系统开销为优化目标,构建深度强化学习模型;S4:提出一种基于最大熵框架的柔性制动策略,进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法,在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。

    基于强化学习TD3算法的异构无线网络垂直切换方法

    公开(公告)号:CN113784410A

    公开(公告)日:2021-12-10

    申请号:CN202111120444.5

    申请日:2021-09-24

    Applicant: 吉林大学

    Abstract: 本发明专利公开了基于强化学习TD3算法的异构无线网络垂直切换方法,具体涉及通讯技术领域。包括如下步骤:采用熵权法计算网络状态参数的权重,构造奖励函数;初始化策略网络以及两个估计网络,对上述网络对应的目标网络初始化,并初始化经验池;演员当前网络根据网络状态参数做出切换决策,求得奖励值;采用梯度下降法训练评论家当前网络,采用梯度上升法训练演员当前网络,更新演员目标网络参数和评论家目标网络参数;在每个决策时刻进行S4‑S5的操作步骤,训练更新网络参数;根据训练好的策略网络来确定最优的切换策略。采用本发明技术方案解决了深度强化学习汇总网络参数状态动作值过高估计的问题,可用于快速选出最优切换决策。

    一种人参皂苷衍生物及其合成方法与应用

    公开(公告)号:CN113480591A

    公开(公告)日:2021-10-08

    申请号:CN202110585522.2

    申请日:2021-05-27

    Applicant: 吉林大学

    Abstract: 本发明涉及医药技术领域,尤其涉及一种人参皂苷衍生物及其合成方法与应用,该人参皂苷衍生物合成方法为:(a)以原人参二醇为前体,以吡啶为溶剂,和醋酸酐反应得到原人参二醇的3‑,12‑双取代醋酸酯(Ⅱ);(b)以3,4,6‑O‑三乙酰基‑D‑葡萄糖烯为原料,经催化,与水和乙腈反应后,经催化,与干燥二氯甲烷反应得3,4,6‑O‑三乙酰基‑D‑葡萄糖烯衍生物(Ⅴ);(c)化合物Ⅱ与Ⅴ,经路易斯酸和分子筛的作用后,在碱条件下,甲醇解得到2′‑脱氧人参皂苷CK。本发明提供的人参皂苷衍生物具有糖酵解抑制活性,当制备糖酵解抑制剂后,具有较强的抗癌活性,能应用于制备治疗肿瘤药物之中,特别是应用于胃癌、结肠癌、肺癌、前列腺癌、肝癌及乳腺癌等药物。

Patent Agency Ranking