Patent search ap:("吉林大学") AND inv:"张继真" Page 1

1.

发明公开
一种基于深度强化学习的MEC任务卸载和资源分配方法有权转让

公开(公告)号：CN113612843A

公开(公告)日：2021-11-05

申请号：CN202110882738.5

申请日：2021-08-02

Applicant: 吉林大学

Inventor： 钱志鸿 , 张菁 , 王雪 , 向长波 , 张继真 , 谢明桐 , 刘水

IPC: H04L29/08 , H04L12/911 , H04L12/24 , G06N20/00

Abstract: 本发明公开的属于通信技术领域，具体为一种基于深度强化学习的MEC任务卸载和资源分配方法，包括以下步骤：S1：在移动边缘计算场景下，构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型，并初始化系统参数；S2：针对三层的卸载场景，计算系统总体开销；S3：以最小化系统开销为优化目标，构建深度强化学习模型；S4：提出一种基于最大熵框架的柔性制动策略，进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法，在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。

2.

发明授权
大规模机器类通信基于机器学习的随机接入退避方法有权

公开(公告)号：CN113573284B

公开(公告)日：2023-05-12

申请号：CN202110685469.3

申请日：2021-06-21

Applicant: 吉林大学

Inventor： 钱志鸿 , 谢明桐 , 王雪 , 丛玉良 , 刘桂岐 , 张继真 , 李华亮

IPC: H04W4/70 , H04W74/08

Abstract: 本发明属于物联网通信技术领域，公开了大规模机器类通信基于机器学习的随机接入退避方法，包括S1：动态划分虚拟小小区，对MTCD业务分类；S2：针对退避接入问题建立马尔可夫决策过程；S3：获取MTCD服务质量参数，构建奖励函数；S4：构建评价网络Critic和策略网络Actor；S5：利用策略网络Actor生成退避接入决策；S6：最小化TD误差，更新评价网络Critic神经网络参数，并将TD误差传递给策略网络Actor；S7：获取TD误差作为优势函数更新策略网络Actor的神经网络参数，调整策略以改进回报；S8：进行N次循环迭代，训练更新网络参数；S9：为MTCD选择最优的退避接入时隙；本发明解决了现有技术MTCD随机接入网络所造成的网络拥塞问题，适用于MTCD随机接入网络。

3.

发明授权
一种基于深度强化学习的MEC任务卸载和资源分配方法有权转让

公开(公告)号：CN113612843B

公开(公告)日：2022-08-30

申请号：CN202110882738.5

申请日：2021-08-02

Applicant: 吉林大学

Inventor： 钱志鸿 , 张菁 , 王雪 , 向长波 , 张继真 , 谢明桐 , 刘水

IPC: H04L67/10 , H04L41/0894 , H04L41/14 , H04L47/78 , G06N20/00

Abstract: 本发明公开的属于通信技术领域，具体为一种基于深度强化学习的MEC任务卸载和资源分配方法，包括以下步骤：S1：在移动边缘计算场景下，构建包括云服务器、移动边缘计算服务器与终端设备的三层计算卸载与资源分配模型，并初始化系统参数；S2：针对三层的卸载场景，计算系统总体开销；S3：以最小化系统开销为优化目标，构建深度强化学习模型；S4：提出一种基于最大熵框架的柔性制动策略，进行卸载决策和资源分配决策。该基于深度强化学习的MEC任务卸载和资源分配方法，在保证满足不同用户服务质量需求的情况下不仅有效利用了系统的资源而且能帮助用户选择最优卸载策略以最小化系统开销。

4.

发明公开
大规模机器类通信基于机器学习的随机接入退避方法有权

公开(公告)号：CN113573284A

公开(公告)日：2021-10-29

申请号：CN202110685469.3

申请日：2021-06-21

Applicant: 吉林大学

Inventor： 钱志鸿 , 谢明桐 , 王雪 , 丛玉良 , 刘桂岐 , 张继真 , 李华亮

IPC: H04W4/70 , H04W74/08

Abstract: 本发明属于物联网通信技术领域，公开了大规模机器类通信基于机器学习的随机接入退避方法，包括S1：动态划分虚拟小小区，对MTCD业务分类；S2：针对退避接入问题建立马尔可夫决策过程；S3：获取MTCD服务质量参数，构建奖励函数；S4：构建评价网络Critic和策略网络Actor；S5：利用策略网络Actor生成退避接入决策；S6：最小化TD误差，更新评价网络Critic神经网络参数，并将TD误差传递给策略网络Actor；S7：获取TD误差作为优势函数更新策略网络Actor的神经网络参数，调整策略以改进回报；S8：进行N次循环迭代，训练更新网络参数；S9：为MTCD选择最优的退避接入时隙；本发明解决了现有技术MTCD随机接入网络所造成的网络拥塞问题，适用于MTCD随机接入网络。

Patent Agency Ranking