一种面向深度学习训练任务的多资源共享调度方法

    公开(公告)号:CN116932201A

    公开(公告)日:2023-10-24

    申请号:CN202310124944.9

    申请日:2023-02-07

    Applicant: 北京大学

    Abstract: 本发明实施例提供一种面向深度学习训练任务的多资源共享调度方法。所述方法包括:获取提交至任务队列中的各个训练任务的资源使用数据;根据获取的所述资源使用数据和共享机制,确定训练任务之间的共享效率;根据获取的所述资源使用数据和所述共享效率,确定共享调度方案;通过所述共享调度方案,控制执行器集群进行训练任务的执行。旨在通过多资源共享和调度,大幅提高集群中多种资源利用率和大幅减少深度学习训练任务的完成时间。

Patent Agency Ranking