-
公开(公告)号:CN117015763A
公开(公告)日:2023-11-07
申请号:CN202280022711.1
申请日:2022-03-08
Applicant: 微软技术许可有限责任公司
IPC: G06F9/50
Abstract: 本文中的公开内容描述了在云基础设施平台中管理人工智能(AI)工作负载。分布式基础设施资源集合经由本地支持接口集成到云基础设施平台中。从多个租户接收AI工作负载,其中AI工作负载包括训练工作负载和推理工作负载,并且分布式基础设施资源集合的资源子集被指派给所接收到的AI工作负载。所接收到的AI工作负载被调度用于在所指派的资源子集上执行并且基于对AI工作负载的调度,它们在所指派的资源子集上被执行。所描述的云基础设施平台为许多不同的租户提供了高效安全的AI工作负载执行,并且使得能够灵活使用广泛多种第三方基础设施资源和第一方基础设施资源。