Patent search ap:("无锡学院") AND inv:"刘子怡" Page 1

1.

发明授权
基于A2C算法优化混合供电异构网中能源效率的方法有权

公开(公告)号：CN116132997B

公开(公告)日：2024-12-13

申请号：CN202310082022.6

申请日：2023-01-17

Applicant: 无锡学院

Inventor： 李君 , 刘子怡 , 刘兴鑫 , 李晨

IPC: H04W16/18 , H04W16/22 , H04W88/08 , G06N3/092 , G06N3/045 , G06N3/047 , G06N7/01

Abstract: 本发明公开了基于A2C算法优化混合供电异构网中能源效率的方法，根据宏基站与小基站的数量分布情况确定小基站的用户位置；将单个小基站看作一个智能体，建立马尔科夫决策过程的状态空间、动作空间和奖励函数；小基站用户和环境交互随机获得状态；将动作信息(st,at,rt,st+1)传递给critic网络；将各个小基站学习所获得的最优动作作为状态传递给宏基站，在宏基站覆盖范围内重复部署小基站，得到最优的小基站部署策略，即资源分配最优；使用户连接到相应的小基站以获得更好的信道，最大化异构网络系统的能源效率。本发明通过使用强化学习中的A2C算法来提高A2C算法中的能源效率，使用高斯分布的方法来逼近状态动作值函数，节省传统电网的资源，节约电网通信能耗的成本。

2.

发明公开
一种异构网中用户关联和功率分配方法、系统审中-实审

公开(公告)号：CN116528248A

公开(公告)日：2023-08-01

申请号：CN202310556053.0

申请日：2023-05-17

Applicant: 无锡学院

Inventor： 李君 , 刘子怡 , 刘兴鑫 , 李晨

IPC: H04W16/10 , H04W16/22 , H04W52/14 , H04W52/34

Abstract: 本发明公开了一种异构网中用户关联和功率分配方法、系统，所述方法包括：步骤1：建立异构网络模型，确定用户从小基站接收信号的信干噪比；步骤2：将小基站作为智能体，建立马尔可夫决策过程，确定状态，动作和奖励；步骤3：构建并训练神经网络，将相应的训练数据集输入神经网络中，训练神经网络直到收敛，在小基站中应用MDS编码缓存方案，协调不同小基站中的缓存内容；步骤4：将奖励设为基站的传输速率；采用对数效用函数作为优化目标，最大化用户的平均传输速率。通过本发明方法，优化异构网络中的功率分配，训练神经网络找到每个小基站的最佳功率，实现异构网中用户关联和最大化异构网络中用户的传输速率。

3.

发明公开
一种基于深度强化学习算法的D2D用户资源分配方法及存储介质审中-实审

公开(公告)号：CN116456493A

公开(公告)日：2023-07-18

申请号：CN202310426343.3

申请日：2023-04-20

Applicant: 无锡学院

Inventor： 李君 , 刘兴鑫 , 刘子怡 , 沈国丽 , 张茜茜 , 李晨

IPC: H04W72/40 , H04W72/50 , H04W72/543 , H04W52/02 , H04W24/02 , G06N3/045 , G06N3/092 , G06N7/01

Abstract: 本发明公开了一种基于深度强化学习算法的D2D用户资源分配方法及存储介质，涉及无线通信技术领域。所述方法包括：构建无线网络模型，对D2D发射功率进行离散化处理；构建用户信噪比计算模型，以通信系统吞吐量最大为优化目标；设置预测策略网络π、预测价值网络Q、目标策略网络π′和目标价值网络Q'；将D2D通信环境建模为马尔可夫决策过程，将D2D发射机视为智能体，循环加载目标策略网络的参数后生成策略与环境进行交互，确定状态空间、动作空间及奖励函数；采用MAAC算法对每个D2D用户进行策略优化；采用软更新方式循环更新目标策略网络和目标价值网络的参数，直至完成学习训练；D2D用户下载完成训练的目标策略网络的参数，进行策略改进。

4.

发明公开
一种基于强化学习的能量收集D2D通信资源分配方法及存储介质审中-实审

公开(公告)号：CN116709546A

公开(公告)日：2023-09-05

申请号：CN202310429288.3

申请日：2023-04-20

Applicant: 无锡学院

Inventor： 李君 , 刘兴鑫 , 刘子怡 , 沈国丽 , 张茜茜 , 李晨

IPC: H04W72/40

Abstract: 本发明公开了一种基于强化学习的能量收集D2D通信资源分配方法及存储介质，涉及无线通信技术领域。所述方法包括：构建无线网络模型；构建无线网络模型的优化问题；将优化问题转化为马尔可夫决策过程，确定智能体、状态空间、动作空间及奖励函数；采用深度强化学习方法，对每个智能体进行自主学习，得到通信资源分配方案；其中，所述深度强化学习方法中引入PPO算法限制更新幅度。相较于现有技术，本发明克服了传统通信终端仅依靠电池功能的限制，在高速传输信息的同时，通过PPO算法应对复杂多变的通信场景。

5.

发明公开
基于A2C算法优化混合供电异构网中能源效率的方法有权

公开(公告)号：CN116132997A

公开(公告)日：2023-05-16

申请号：CN202310082022.6

申请日：2023-01-17

Applicant: 无锡学院

Inventor： 李君 , 刘子怡 , 刘兴鑫 , 李晨

IPC: H04W16/18 , H04W16/22 , H04W88/08 , G06N3/092 , G06N3/045 , G06N3/047 , G06N7/01

Abstract: 本发明公开了基于A2C算法优化混合供电异构网中能源效率的方法，根据宏基站与小基站的数量分布情况确定小基站的用户位置；将单个小基站看作一个智能体，建立马尔科夫决策过程的状态空间、动作空间和奖励函数；小基站用户和环境交互随机获得状态；将动作信息(st,at,rt,st+1)传递给critic网络；将各个小基站学习所获得的最优动作作为状态传递给宏基站，在宏基站覆盖范围内重复部署小基站，得到最优的小基站部署策略，即资源分配最优；使用户连接到相应的小基站以获得更好的信道，最大化异构网络系统的能源效率。本发明通过使用强化学习中的A2C算法来提高A2C算法中的能源效率，使用高斯分布的方法来逼近状态动作值函数，节省传统电网的资源，节约电网通信能耗的成本。

6.

发明公开
一种异构网络中基于强化学习的动态资源分配优化方法审中-实审

公开(公告)号：CN116095690A

公开(公告)日：2023-05-09

申请号：CN202310065762.9

申请日：2023-01-17

Applicant: 无锡学院

Inventor： 李君 , 刘子怡 , 刘兴鑫 , 李晨

IPC: H04W16/10 , H04W16/14 , H04W16/18 , H04W16/32 , H04B17/336 , H04B17/382 , G06N3/045 , G06N3/092 , G06N3/0985 , G06N7/01 , H04W84/04 , H04W88/08

Abstract: 本发明公开了一种异构网络中基于强化学习的动态资源分配优化方法，步骤1：建立异构网络模型，明确以能量效率为最大的优化目标；将宏基站看作智能体，建立马尔可夫决策过程，确定状态空间、动作空间和奖励函数；划分宏基站覆盖区域和异构网络带宽；通过D3QN网络训练异构网络模型，设定宏基站和小基站的最大发射功率，计算宏基站到用户的信干噪比，最小化损失函数；在dueling DQN网络中引入double DQN网络以获得值函数和优势函数，确定最优的异构网络超参数K和β，最大化异构网络的能量效率，实现动态资源分配优化。本发明提出集中强化学习框架的异构网络模型，以实现动态资源分配的全局最优，提出用D3QN网络来优化负载均衡和干扰协调，最大化异构网络的能量效率，实现动态资源分配优化。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification