一种减少作业共置竞争的干扰感知调度方法

    公开(公告)号:CN118747122A

    公开(公告)日:2024-10-08

    申请号:CN202410892082.9

    申请日:2024-07-04

    Abstract: 本发明涉及大数据与云计算技术领域,具体涉及一种减少作业共置竞争的干扰感知调度方法,首先,设计一个干扰预测模型,用于预测不同作业在GPU中的干扰程度。干扰的定义为作业共置完成时间和作业独占完成时间之差,时间之差是由于干扰竞争减速带来的延迟;然后,通过设计一个动态调整作业组合的方法,找到若干个符合当前条件下的干扰最小的共置组合,并将该组合中的作业同时放入到GPU中执行。具体分为预测与调度两个部分,基于权重值的计算策略,并通过在线调度的方式,实现了对作业需求动态变化的动态响应和调整。通过一系列实验对比,发现本发明的作业完成时间明显优于其他传统调度方法,且能耗最低,充分验证了本发明的高效性和实用性。

    一种加速分布式训练作业的自适应调度方法

    公开(公告)号:CN118779077A

    公开(公告)日:2024-10-15

    申请号:CN202410891413.7

    申请日:2024-07-04

    Abstract: 本发明涉及人工智能及大数据技术领域,具体涉及一种加速分布式训练作业的自适应调度方法,涉及调度、迁移和预留三个过程,首先,通过建模分析和机器学习来预测作业完成时间,设计最佳作业划分方法。然后,考虑到了作业迁移的开销,设计了一种预估作业迁移开销的方法来减少开销。最后,由于迁移的开销不可忽略性,因此设计了预留方法来减少非必要的迁移。本发明分别采用基于作业和节点特征的预测模型以及分层选择策略进行高效调度。通过分析作业迁移的必要性并考虑迁移代价,以及调度与迁移的关系,为调度方法设计了用于优化的预留方法。

Patent Agency Ranking