-
公开(公告)号:CN114971819A
公开(公告)日:2022-08-30
申请号:CN202210309611.9
申请日:2022-03-28
Applicant: 东北大学
Abstract: 本发明公开一种基于多智能体强化学习算法在联邦学习下的用户竞价方法及装置,方法包括:获取联邦学习平台发布的学习任务,样本客户端利用强化学习算法向联邦平台上传竞标信息,平台通过算法选取样本客户端后下向被选中的样本客户端下发全局共享模型,被选中的样本客户端进行本地训练并上传更新参数,平台将上传的更新模型参数按照聚合算法进行聚合并对全局模型中的模型参数进行更新。以完成联邦学习平台发布的学习任务,此方法在实现联邦学习参与用户的动态竞价的同时缓解了模型的过拟合,解决了现有基于拍卖的激励机制由于用户提交竞价策略后,用户竞价策略在后续训练过程中不会发生改变而导致联邦学习公平性缺失以及模型过拟合的问题。
-
公开(公告)号:CN112600759B
公开(公告)日:2022-06-03
申请号:CN202011434403.9
申请日:2020-12-10
Applicant: 东北大学
IPC: H04L47/125 , H04L45/243 , H04L45/00 , G06N3/08
Abstract: 本发明实施例公开一种基于深度强化学习在Overlay网络下多路径流量调度方法及系统。该方法包括:调度器,收集每条传输路径的路径状态信息;构建包含各路径状态信息的当前状态矩阵,将当前状态矩阵输入策略网络中,得到各传输路径对应的路径状态评估值和流量分配比例值;根据流量分配比例值执行对数据报文的转发动作;转发后获取调度参数,根据调度参数计算奖励值,收集当前状态;构建元组传入到收集器的经验回放池中;训练器,获取数据元组,将数据元组输入主网络和目标网络中,更新主网络和目标网络的参数;根据主网络和目标网络的参数更新策略网络的参数。应用本发明实施例提供的方案,能够实现网络负载均衡,降低网络拥塞和丢包率、提高传输速率。
-
公开(公告)号:CN111447142A
公开(公告)日:2020-07-24
申请号:CN202010268639.3
申请日:2020-04-08
Applicant: 东北大学
IPC: H04L12/707 , H04L12/715
Abstract: 本发明提供一种基于Overlay网络和编码技术的并行多路径传输方法,涉及数据网络技术领域。源网关节点截获网络层报文,并根据报文的目的地址将三层数据报文的目的地址修改成覆盖网络的中间节点地址;而该数据报文的真实目的地址隐藏在TCP Option字段中。同时,源网关节点对截取的数据报文的TCP载荷使用可擦除码进行编码,在覆盖网络中传输的数据为编码后的数据。覆盖网络的中间节点接收数据后查询定制路由表,将三层数据报文的目的地址继续修改成下一跳节点并继续转发。当目的网关收到上述三层数据报文后,先进行TCP载荷解码,然后将TCP Option字段中目的地址取出来,修改三层数据报文的目的地址后发送至目的通信节点。本发明方法能够实现透明的、高可靠的并行多路径传输。
-
公开(公告)号:CN115358831A
公开(公告)日:2022-11-18
申请号:CN202211120985.2
申请日:2022-09-15
Applicant: 东北大学
Abstract: 本发明公开一种基于多智能体强化学习算法在联邦学习下的用户竞价方法及装置,方法包括:获取联邦学习平台发布的学习任务,样本客户端利用强化学习算法向联邦平台上传竞标信息,平台通过算法选取样本客户端后下向被选中的样本客户端下发全局共享模型,被选中的样本客户端进行本地训练并上传更新参数,平台将上传的更新模型参数按照聚合算法进行聚合并对全局模型中的模型参数进行更新。以完成联邦学习平台发布的学习任务,此方法在实现联邦学习参与用户的动态竞价的同时缓解了模型的过拟合,解决了现有基于拍卖的激励机制由于用户提交竞价策略后,用户竞价策略在后续训练过程中不会发生改变而导致联邦学习公平性缺失以及模型过拟合的问题。
-
公开(公告)号:CN111447142B
公开(公告)日:2021-09-28
申请号:CN202010268639.3
申请日:2020-04-08
Applicant: 东北大学
IPC: H04L12/707 , H04L12/715
Abstract: 本发明提供一种基于Overlay网络和编码技术的并行多路径传输方法,涉及数据网络技术领域。源网关节点截获网络层报文,并根据报文的目的地址将三层数据报文的目的地址修改成覆盖网络的中间节点地址;而该数据报文的真实目的地址隐藏在TCP Option字段中。同时,源网关节点对截取的数据报文的TCP载荷使用可擦除码进行编码,在覆盖网络中传输的数据为编码后的数据。覆盖网络的中间节点接收数据后查询定制路由表,将三层数据报文的目的地址继续修改成下一跳节点并继续转发。当目的网关收到上述三层数据报文后,先进行TCP载荷解码,然后将TCP Option字段中目的地址取出来,修改三层数据报文的目的地址后发送至目的通信节点。本发明方法能够实现透明的、高可靠的并行多路径传输。
-
公开(公告)号:CN112600759A
公开(公告)日:2021-04-02
申请号:CN202011434403.9
申请日:2020-12-10
Applicant: 东北大学
IPC: H04L12/803 , H04L12/709 , H04L12/721 , G06N3/08
Abstract: 本发明实施例公开一种基于深度强化学习在Overlay网络下多路径流量调度方法及系统。该方法包括:调度器,收集每条传输路径的路径状态信息;构建包含各路径状态信息的当前状态矩阵,将当前状态矩阵输入策略网络中,得到各传输路径对应的路径状态评估值和流量分配比例值;根据流量分配比例值执行对数据报文的转发动作;转发后获取调度参数,根据调度参数计算奖励值,收集当前状态;构建元组传入到收集器的经验回放池中;训练器,获取数据元组,将数据元组输入主网络和目标网络中,更新主网络和目标网络的参数;根据主网络和目标网络的参数更新策略网络的参数。应用本发明实施例提供的方案,能够实现网络负载均衡,降低网络拥塞和丢包率、提高传输速率。
-
-
-
-
-