-
公开(公告)号:CN111131080B
公开(公告)日:2021-09-07
申请号:CN201911363582.9
申请日:2019-12-26
Applicant: 电子科技大学
IPC: H04L12/861 , H04L12/935 , H04L12/865 , H04L12/24 , G06F9/50
Abstract: 本发明公开了一种分布式深度学习流调度方法、系统、设备,涉及计算机技术领域。分布式深度学习流调度设备能够部署分布式深度学习流调度系统,并采用分布式深度学习流调度方法实现流调度。本发明方法从DDL训练的流特点出发,提出采用高精度改善优先的调度方式,对DDL训练任务进行数据流调度。本发明对DDL训练任务进行优先级划分,并周期性的更新DDL训练任务的优先级。其中通过DDL训练任务的历史数据预测该任务未来一个调度周期的精度改善情况,并以此进行排序进而确定DDL训练任务的优先级。同时,本发明考虑了网络优先级有限的情况,并通过全局优先级映射为本地优先级的方式,实现了少量优先级模拟无限优先级的可能。
-
公开(公告)号:CN111131080A
公开(公告)日:2020-05-08
申请号:CN201911363582.9
申请日:2019-12-26
Applicant: 电子科技大学
IPC: H04L12/861 , H04L12/935 , H04L12/865 , H04L12/24 , G06F9/50
Abstract: 本发明公开了一种分布式深度学习流调度方法、系统、设备,涉及计算机技术领域。分布式深度学习流调度设备能够部署分布式深度学习流调度系统,并采用分布式深度学习流调度方法实现流调度。本发明方法从DDL训练的流特点出发,提出采用高精度改善优先的调度方式,对DDL训练任务进行数据流调度。本发明对DDL训练任务进行优先级划分,并周期性的更新DDL训练任务的优先级。其中通过DDL训练任务的历史数据预测该任务未来一个调度周期的精度改善情况,并以此进行排序进而确定DDL训练任务的优先级。同时,本发明考虑了网络优先级有限的情况,并通过全局优先级映射为本地优先级的方式,实现了少量优先级模拟无限优先级的可能。
-