一种GPU算力资源的调度方法、装置

    公开(公告)号:CN118885273A

    公开(公告)日:2024-11-01

    申请号:CN202411047342.9

    申请日:2024-07-31

    Abstract: 一种GPU算力资源的调度方法,包括:响应于在计算集群中创建的目标计算任务,确定所述目标计算任务的任务类型;如果所述目标计算任务为所述第一类计算任务,将所述目标计算任务调度至所述计算集群中的剩余算力资源满足所述目标计算任务的算力需求的第一GPU硬件进行运行;响应于搭载所述第一GPU硬件的第一计算节点上报的所述第一类计算任务将独占所述第一GPU硬件的算力资源的第一指示,将已调度至所述第一GPU硬件进行运行的所述第二类计算任务,重新调度至所述计算集群中的剩余算力资源满足所述第二类计算任务的算力需求的第二GPU硬件进行运行;所述第一类计算任务的服务等级高于所述第二类计算任务。

    GPU混部下的分布式任务执行方法和系统

    公开(公告)号:CN119396608A

    公开(公告)日:2025-02-07

    申请号:CN202411548262.1

    申请日:2024-10-31

    Abstract: 本说明书实施例提供了GPU混部下的分布式任务执行方法和系统,其应用于包含多个GPU的平台,其中部署有第一类任务和第二类任务,第二类任务的优先级低于第一类任务。任务执行的方法包括:目标应用调用集合通信库,请求执行GPU间的目标通信操作,其中,该目标应用属于第二类任务。然后,集合通信库确定出目标通信操作涉及的子任务列表,其中包括分布于不同GPU的多个子任务;通过进程间同步操作,使得所述多个子任务向GPU驱动环境同步提交通信kerne l。GPU驱动环境在确定上述通信kerne l启用同步提交的情况下,立即向GPU提交所述通信kerne l。

Patent Agency Ranking