-
公开(公告)号:CN116483562A
公开(公告)日:2023-07-25
申请号:CN202310421157.0
申请日:2023-04-14
Applicant: 济南浪潮数据技术有限公司
Abstract: 本发明提出了一种云平台GPU资源管理方法、装置、服务器及存储介质,方法包括:在资源池的每个资源节点中预设GPU检测程序;周期性地执行GPU检测程序以获得本地服务器上连接的GPU的数量和型号,并更新至资源池的GPU管理配置文件中;响应于接收到用户的服务请求,读取GPU管理配置文件以向用户提供可操作的GPU型号列表;响应于接收到用户基于GPU型号列表的配置请求,为用户创建工作负载,并为工作负载配置执行配置请求的管理节点以及提供负载计算的资源节点。本发明使得云平台可以通过本方法及装置,实现对指定GPU型号的资源调度,并允许用户指定GPU型号及其配额,通过配额监控实现了云平台对异构加速设备GPU的精细化管理控制,同时能够提高云平台的实用性。