一种机器学习模型在集群中的处理方法、装置及存储介质

    公开(公告)号:CN115543537A

    公开(公告)日:2022-12-30

    申请号:CN202211247259.7

    申请日:2022-10-12

    Abstract: 本申请涉及一种机器学习模型在集群中的处理方法、装置及存储介质,该方法包括:获取模型训练调度请求,所述模型训练调度请求用于对集群中的数据库中的目标模型进行训练,所述模型训练调度请求中包括训练参数、模型识别参数和资源参数;所述数据库中存储有多个机器学习模型,所述目标模型为多个所述机器学习模型中的任一模型;基于所述集群本地的镜像资源构建容器镜像,并将所述调度请求中所包括的参数内置与所述容器镜像中;基于所述容器镜像对所述目标模型进行训练;在训练完成后,将训练完成后的所述目标模型的信息注册至所述集群的注册表中并发布已注册的所述信息。通过本申请,解决了现有技术中需要单独为每个机器学习任务分配GPU的问题。

Patent Agency Ranking