一种模型部署方法、装置、设备及存储介质

    公开(公告)号:CN114721674A

    公开(公告)日:2022-07-08

    申请号:CN202210448435.7

    申请日:2022-04-26

    Abstract: 本发明公开了一种模型部署方法、装置、设备及存储介质。该方法包括:获取模型配置信息、元数据和模型文件,其中,所述模型配置信息包括:环境镜像信息;将所述模型文件和所述模型配置信息上传至测试Kubernetes集群的本地,并将所述模型配置信息写入后台数据库;根据所述模型配置信息生成第一yaml配置文件;接收测试指令,并将所述测试指令发送至所述测试Kubernetes集群,以使所述测试Kubernetes集群根据所述第一yaml配置文件部署模型,通过本发明的技术方案,解决了模型管理中的元数据信息缺失、缺乏模型评估结果、模型部署中的计算资源监控缺失以及缺乏弹性扩容的问题。能够简化模型部署的过程,支持动态弹性扩容,可以随时增加模型计算总资源。

Patent Agency Ranking