基于A2C算法优化混合供电异构网中能源效率的方法

    公开(公告)号:CN116132997B

    公开(公告)日:2024-12-13

    申请号:CN202310082022.6

    申请日:2023-01-17

    Applicant: 无锡学院

    Abstract: 本发明公开了基于A2C算法优化混合供电异构网中能源效率的方法,根据宏基站与小基站的数量分布情况确定小基站的用户位置;将单个小基站看作一个智能体,建立马尔科夫决策过程的状态空间、动作空间和奖励函数;小基站用户和环境交互随机获得状态;将动作信息(st,at,rt,st+1)传递给critic网络;将各个小基站学习所获得的最优动作作为状态传递给宏基站,在宏基站覆盖范围内重复部署小基站,得到最优的小基站部署策略,即资源分配最优;使用户连接到相应的小基站以获得更好的信道,最大化异构网络系统的能源效率。本发明通过使用强化学习中的A2C算法来提高A2C算法中的能源效率,使用高斯分布的方法来逼近状态动作值函数,节省传统电网的资源,节约电网通信能耗的成本。

    基于异步深度强化学习的RSU辅助多跳任务卸载方法

    公开(公告)号:CN119996446A

    公开(公告)日:2025-05-13

    申请号:CN202510091288.6

    申请日:2025-01-21

    Applicant: 无锡学院

    Abstract: 本发明公开了一种基于异步深度强化学习的RSU辅助多跳任务卸载方法,涉及边缘卸载和深度强化技术领域,通过建立车辆移动模型和通信模型,精确评估节点之间的连接稳定性;将任务卸载问题建模为一个高维MDP,并采用A3C算法求解该问题;A3C算法通过异步训练多个智能体,有效处理了大规模动作空间下的优化问题,从而在复杂多变的车联网环境中实现了更优的任务卸载策略;与现有的任务卸载策略相比,本发明方法在减少任务处理延迟和提高计算资源利用率方面表现出显著的性能提升,特别是在多RSU和高动态性场景下,显著提高了系统的任务完成率和资源利用效率;此外,本发明还具有良好的扩展性,能够适应未来车联网中更加复杂的应用需求。

    一种异构网中用户关联和功率分配方法、系统

    公开(公告)号:CN116528248A

    公开(公告)日:2023-08-01

    申请号:CN202310556053.0

    申请日:2023-05-17

    Applicant: 无锡学院

    Abstract: 本发明公开了一种异构网中用户关联和功率分配方法、系统,所述方法包括:步骤1:建立异构网络模型,确定用户从小基站接收信号的信干噪比;步骤2:将小基站作为智能体,建立马尔可夫决策过程,确定状态,动作和奖励;步骤3:构建并训练神经网络,将相应的训练数据集输入神经网络中,训练神经网络直到收敛,在小基站中应用MDS编码缓存方案,协调不同小基站中的缓存内容;步骤4:将奖励设为基站的传输速率;采用对数效用函数作为优化目标,最大化用户的平均传输速率。通过本发明方法,优化异构网络中的功率分配,训练神经网络找到每个小基站的最佳功率,实现异构网中用户关联和最大化异构网络中用户的传输速率。

    一种基于深度强化学习算法的D2D用户资源分配方法及存储介质

    公开(公告)号:CN116456493A

    公开(公告)日:2023-07-18

    申请号:CN202310426343.3

    申请日:2023-04-20

    Applicant: 无锡学院

    Abstract: 本发明公开了一种基于深度强化学习算法的D2D用户资源分配方法及存储介质,涉及无线通信技术领域。所述方法包括:构建无线网络模型,对D2D发射功率进行离散化处理;构建用户信噪比计算模型,以通信系统吞吐量最大为优化目标;设置预测策略网络π、预测价值网络Q、目标策略网络π′和目标价值网络Q';将D2D通信环境建模为马尔可夫决策过程,将D2D发射机视为智能体,循环加载目标策略网络的参数后生成策略与环境进行交互,确定状态空间、动作空间及奖励函数;采用MAAC算法对每个D2D用户进行策略优化;采用软更新方式循环更新目标策略网络和目标价值网络的参数,直至完成学习训练;D2D用户下载完成训练的目标策略网络的参数,进行策略改进。

    一种面向网络孪生驱动的边缘计算任务卸载方法

    公开(公告)号:CN119718646A

    公开(公告)日:2025-03-28

    申请号:CN202411787875.0

    申请日:2024-12-06

    Applicant: 无锡学院

    Abstract: 本发明公开了一种面向网络孪生驱动的边缘计算任务卸载方法,涉及移动边缘计算技术领域,考虑了一个网络孪生系统,包括用户终端设备、边缘服务器和云服务器;根据网络孪生模型中的数据,动态调整资源的分配,这样可以在实际网络中实现更灵活的资源部署,满足不同用户和设备的需求;优化边缘设备和云端计算资源之间的协作,通过有效的任务卸载策略平衡计算负载和资源利用率;通过结合深度强化学习和改进的图注意力网络,提出了一种节能且安全的部分卸载方案,这种方法可以更智能地分配资源,并优化任务卸载过程,减少不必要的计算和通信,进而提高系统整体的效率。

    一种基于强化学习的能量收集D2D通信资源分配方法及存储介质

    公开(公告)号:CN116709546A

    公开(公告)日:2023-09-05

    申请号:CN202310429288.3

    申请日:2023-04-20

    Applicant: 无锡学院

    Abstract: 本发明公开了一种基于强化学习的能量收集D2D通信资源分配方法及存储介质,涉及无线通信技术领域。所述方法包括:构建无线网络模型;构建无线网络模型的优化问题;将优化问题转化为马尔可夫决策过程,确定智能体、状态空间、动作空间及奖励函数;采用深度强化学习方法,对每个智能体进行自主学习,得到通信资源分配方案;其中,所述深度强化学习方法中引入PPO算法限制更新幅度。相较于现有技术,本发明克服了传统通信终端仅依靠电池功能的限制,在高速传输信息的同时,通过PPO算法应对复杂多变的通信场景。

    基于A2C算法优化混合供电异构网中能源效率的方法

    公开(公告)号:CN116132997A

    公开(公告)日:2023-05-16

    申请号:CN202310082022.6

    申请日:2023-01-17

    Applicant: 无锡学院

    Abstract: 本发明公开了基于A2C算法优化混合供电异构网中能源效率的方法,根据宏基站与小基站的数量分布情况确定小基站的用户位置;将单个小基站看作一个智能体,建立马尔科夫决策过程的状态空间、动作空间和奖励函数;小基站用户和环境交互随机获得状态;将动作信息(st,at,rt,st+1)传递给critic网络;将各个小基站学习所获得的最优动作作为状态传递给宏基站,在宏基站覆盖范围内重复部署小基站,得到最优的小基站部署策略,即资源分配最优;使用户连接到相应的小基站以获得更好的信道,最大化异构网络系统的能源效率。本发明通过使用强化学习中的A2C算法来提高A2C算法中的能源效率,使用高斯分布的方法来逼近状态动作值函数,节省传统电网的资源,节约电网通信能耗的成本。

    一种异构网络中基于强化学习的动态资源分配优化方法

    公开(公告)号:CN116095690A

    公开(公告)日:2023-05-09

    申请号:CN202310065762.9

    申请日:2023-01-17

    Applicant: 无锡学院

    Abstract: 本发明公开了一种异构网络中基于强化学习的动态资源分配优化方法,步骤1:建立异构网络模型,明确以能量效率为最大的优化目标;将宏基站看作智能体,建立马尔可夫决策过程,确定状态空间、动作空间和奖励函数;划分宏基站覆盖区域和异构网络带宽;通过D3QN网络训练异构网络模型,设定宏基站和小基站的最大发射功率,计算宏基站到用户的信干噪比,最小化损失函数;在dueling DQN网络中引入double DQN网络以获得值函数和优势函数,确定最优的异构网络超参数K和β,最大化异构网络的能量效率,实现动态资源分配优化。本发明提出集中强化学习框架的异构网络模型,以实现动态资源分配的全局最优,提出用D3QN网络来优化负载均衡和干扰协调,最大化异构网络的能量效率,实现动态资源分配优化。

    一种图卷积网络增强的边缘计算任务卸载方法

    公开(公告)号:CN119847634A

    公开(公告)日:2025-04-18

    申请号:CN202411922201.7

    申请日:2024-12-24

    Applicant: 无锡学院

    Abstract: 本发明公开了一种图卷积网络增强的边缘计算任务卸载方法,涉及无线通信技术领域,解决具有异构资源的移动边缘计算系统中的依赖任务卸载问题,GCN是一种机器学习模型,它可以嵌入相邻节点的信息,并有效地结合不同节点的特征进行进一步分类,本发明下载方法的基本原理是利用GCN来描述任务依赖关系,并将依赖任务卸载决策问题转化为节点分类问题;由于任务节点特征可以嵌入在一起,GCN可以根据嵌入结果进行节点分类;然后,通过计算完成执行整个应用程序所需的总时间,来确定卸载决策的优越性,从而提高调度和资源分配的效率,系统能够更有效地应对动态变化和资源限制,从而实现更智能的任务管理。

Patent Agency Ranking