一种基于D3PG模型的任务分解与卸载方法

    公开(公告)号:CN117172302A

    公开(公告)日:2023-12-05

    申请号:CN202310588721.8

    申请日:2023-05-24

    Abstract: 本发明公开了一种基于D3PG模型的任务分解与卸载方法,该方法首先建立一种新的深度强化学习模型DRL,即狄利克雷策略梯度深度确定性模型D3PG,并给出模型的奖励机制。其次对模型进行训练:设置学习环境并创建一个经验应答缓冲区用于收集深度强化学习模型DRL代理与MEC环境交互所收集到的训练数据;深度强化学习模型DRL代理与环境进行交互以生成训练数据集;代理从经验缓冲区中提取训练数据来训练深度强化学习模型DRL模型内的学习网络。最后,利用训练好的狄利克雷策略梯度深度确定性模型D3PG深度学习模型实现联合优化任务分解和计算卸载。本发明能够以端到端的方式优化多个目标,最大化处理任务的数量的同时实现最小化能源消耗。

    一种面向分簇联邦学习的簇内外聚合周期构建方法、系统及其存储介质

    公开(公告)号:CN118586513A

    公开(公告)日:2024-09-03

    申请号:CN202410349095.1

    申请日:2024-03-26

    Abstract: 本发明公开了一种面向分簇联邦学习的簇内外聚合周期构建方法、系统及其存储介质,包括如下步骤:各个不相交簇内所有客户端接收中心服务器下发的某一训练回合所对应的全局模型,并在客户端内利用本地数据集对全局模型进行迭代训练更新以获得本地模型;在每经预设聚合迭代周期I时,各个簇头收集其所在簇内的本地模型进行簇内聚合并将获得的簇内聚合模型下发至簇内客户端重复执行训练更新;在每经预设聚合迭代周期G时,各个簇头将最新的簇内聚合模型上传至中心服务器进行簇间聚合,并将经簇间聚合后获得的全局模型下发至各个簇内所有客户端;重复执行新一轮簇内、簇间训练更新,直至全局模型达到预定训练精度为止。

    一种基于无线联邦学习的学习模型训练方法

    公开(公告)号:CN114841366A

    公开(公告)日:2022-08-02

    申请号:CN202210408140.7

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于无线联邦学习的学习模型训练方法,该方法按以下步骤进行:1)以任务发布者发出的奖励R和移动用户n的本地迭代精度εn作为变量,采用主从博弈法,确定最佳奖励和移动用户n的最佳本地精度值2)系统根据所得奖励值和本地精度值初始化相关参数完成模型训练。本发明中任务发布者通过设定合理的奖励鼓励移动用户参与训练提升模型精度,同时移动用户能够根据自身的资源状态确定本地精度,最终实现任务发布者和移动用户最大化各自的效益。

    一种基于合同理论的多任务无线联邦学习方法

    公开(公告)号:CN115081676B

    公开(公告)日:2024-06-28

    申请号:CN202210500363.6

    申请日:2022-05-09

    Abstract: 本发明公开了一种基于合同理论的多任务无线联邦学习方法,该方法按以下步骤进行:模型拥有者对移动用户进行分簇,每个移动用户簇分别训练不同的联邦学习任务;模型拥有者通过一组最优合同对每个移动用户簇进行激励;其中,每个最优合同包括最佳奖励报酬和最佳全局迭代次数;每个移动用户簇分别执行联邦学习过程,同时完成不同的联邦学习任务。在本发明的合同理论中,模型拥有者有效激励了多个移动用户簇进行数据训练,并且同时完成了多个不同的联邦学习任务,从而提高整体联邦学习过程的工作效率。同时,模型拥有者能够在信息不对称的情况下最大化自己的效益。

    一种基于无线联邦学习的学习模型训练方法

    公开(公告)号:CN114841366B

    公开(公告)日:2024-07-05

    申请号:CN202210408140.7

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于无线联邦学习的学习模型训练方法,该方法按以下步骤进行:1)以任务发布者发出的奖励R和移动用户n的本地迭代精度εn作为变量,采用主从博弈法,确定最佳奖励#imgabs0#和移动用户n的最佳本地精度值#imgabs1#2)系统根据所得奖励值#imgabs2#和本地精度值#imgabs3#初始化相关参数完成模型训练。本发明中任务发布者通过设定合理的奖励鼓励移动用户参与训练提升模型精度,同时移动用户能够根据自身的资源状态确定本地精度,最终实现任务发布者和移动用户最大化各自的效益。

    一种面向集群车辆合作学习的训练方法

    公开(公告)号:CN118246575A

    公开(公告)日:2024-06-25

    申请号:CN202410303218.8

    申请日:2024-03-18

    Abstract: 本发明公开了一种面向集群车辆合作学习的训练方法。首先,服务器将全局模型广播给其覆盖范围的每个车辆客户端,使用迭代K‑means算法实现无需预先设定划分模型个数的模型划分,并对划分后的模型进行分组聚合;然后,基于客户端本地数据质量与相似度的匹配聚类方法,通过簇头选择、簇头匹配模型、车辆客户端匹配簇头,三个过程实现精准聚类;接着,使用双层激励机制方案,在上层,服务器采用Stackelberg博弈机制对各个簇头进行激励,在下层,簇头则采用多维合同理论机制对簇内车辆客户端进行激励。本发明训练方法实现了对车辆客户端的精准聚类,同时激励了多个簇并行训练多个联邦学习任务,从而有效地提高了面向集群车辆合作学习的整体效率。

Patent Agency Ranking