一种机器学习模型在集群中的处理方法、装置及存储介质

    公开(公告)号:CN115543537A

    公开(公告)日:2022-12-30

    申请号:CN202211247259.7

    申请日:2022-10-12

    Abstract: 本申请涉及一种机器学习模型在集群中的处理方法、装置及存储介质,该方法包括:获取模型训练调度请求,所述模型训练调度请求用于对集群中的数据库中的目标模型进行训练,所述模型训练调度请求中包括训练参数、模型识别参数和资源参数;所述数据库中存储有多个机器学习模型,所述目标模型为多个所述机器学习模型中的任一模型;基于所述集群本地的镜像资源构建容器镜像,并将所述调度请求中所包括的参数内置与所述容器镜像中;基于所述容器镜像对所述目标模型进行训练;在训练完成后,将训练完成后的所述目标模型的信息注册至所述集群的注册表中并发布已注册的所述信息。通过本申请,解决了现有技术中需要单独为每个机器学习任务分配GPU的问题。

    一种多平台机器学习任务的在线调度方法及系统

    公开(公告)号:CN116594755B

    公开(公告)日:2023-09-22

    申请号:CN202310854333.X

    申请日:2023-07-13

    Abstract: 本发明提供了一种多平台机器学习任务的在线调度方法及系统,属于在线调度技术领域,其方法包括:实时获取在线平台数量以及每个在线平台所对应的任务数量和任务类型,且结合同类型任务所需的任务执行时间,获取同个在线平台任务的执行流程;分析并获取多个在线平台任务的执行流程之间的流程冲突集;获取机器学习模型及机器学习模型可同时执行的任务数量及任务类型;基于获取结果对所述流程冲突集进行解析,构建得到调度关系网,实现在线调度。通过实时获取所需调度的任务具体情况及流程冲突集,并基于机器学习模型对冲突集进行解析构建调度关系网,能够实时获取任务执行情况,避免任务执行过程中的冲突发生,实现多平台学习任务的在线调度。

    一种多平台机器学习任务的在线调度方法及系统

    公开(公告)号:CN116594755A

    公开(公告)日:2023-08-15

    申请号:CN202310854333.X

    申请日:2023-07-13

    Abstract: 本发明提供了一种多平台机器学习任务的在线调度方法及系统,属于在线调度技术领域,其方法包括:实时获取在线平台数量以及每个在线平台所对应的任务数量和任务类型,且结合同类型任务所需的任务执行时间,获取同个在线平台任务的执行流程;分析并获取多个在线平台任务的执行流程之间的流程冲突集;获取机器学习模型及机器学习模型可同时执行的任务数量及任务类型;基于获取结果对所述流程冲突集进行解析,构建得到调度关系网,实现在线调度。通过实时获取所需调度的任务具体情况及流程冲突集,并基于机器学习模型对冲突集进行解析构建调度关系网,能够实时获取任务执行情况,避免任务执行过程中的冲突发生,实现多平台学习任务的在线调度。

Patent Agency Ranking