-
公开(公告)号:CN116028166A
公开(公告)日:2023-04-28
申请号:CN202111240806.4
申请日:2021-10-25
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种任务管理的方法、装置、设备和存储介质,属于计算机技术领域。该方法包括:向多任务融合共享模块下发多个任务,该多任务融合共享模块运行于计算单元,多个任务中包括至少两个类型不相同的任务,基于每个任务的执行状态信息,确定多个任务中存在异常任务且异常任务满足隔离执行条件,控制该异常任务隔离执行。采用本申请,能够使得不同类型的任务同时执行,进而降低使用多任务融合共享的局限性。
-
公开(公告)号:CN114154641A
公开(公告)日:2022-03-08
申请号:CN202011053283.8
申请日:2020-09-29
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种AI模型的训练方法、装置、计算设备和存储介质,属于人工智能技术领域。该方法应用于AI平台,AI平台与计算资源池相关联,计算资源池包括用于模型训练的计算节点,该方法包括:向用户提供训练配置界面,训练配置界面包括供用户选择的多种训练模式,每种训练模式表示对训练初始AI模型所需的计算节点的一种分配策略,根据用户在训练配置界面的选择,生成至少一个训练任务,执行该至少一个训练任务以对初始AI模型进行训练,获得AI模型,获得的AI模型供用户下载或使用。采用本申请,可以更灵活地执行分布式训练。
-
公开(公告)号:CN117396850A
公开(公告)日:2024-01-12
申请号:CN202180098671.4
申请日:2021-05-28
Applicant: 华为云计算技术有限公司
IPC: G06F9/50
Abstract: 描述了用于为深度学习作业弹性分配资源的系统、方法和处理器可读介质。云计算系统的机器学习即服务(machine‑learning‑as‑a‑service,MLaaS)包括弹性训练模块,所述弹性训练模块包括用于将资源分配给训练作业的资源分配器,所述资源分配器优化所述系统接收的所有训练作业的总体估计完成时间(estimated time to completion,ETC)并使用基于节点的资源分配。所述弹性训练模块可以实现相对于现有方法的高资源利用率、短训练时间和低排队延迟的组合,从而潜在地可以针对向用户(即,客户)提供MLaaS的云计算系统实现更高利润。描述了一种改进的用户界面,使用户能够指定要弹性分配给所述用户的训练作业的资源范围,和/或通知所述用户通过使用弹性资源分配节省的训练时间。
-
公开(公告)号:CN115193053A
公开(公告)日:2022-10-18
申请号:CN202110742189.1
申请日:2021-06-30
Applicant: 华为云计算技术有限公司
IPC: A63F13/58 , A63F13/822 , G06N3/04
Abstract: 本申请提供了一种在云平台配置游戏的推理服务的方法,当在云平台为游戏开发者配置游戏的推理服务时,获取包括针对第一游戏的配置信息的第一配置文件,从而基于云平台的游戏算法框架以及获取的第一配置文件,在云平台配置第一游戏的推理服务。进一步的,还可以基于云平台的游戏算法框架以及第二游戏对应的第二配置文件,在云平台配置第二游戏的推理服务。如此,针对不同游戏,均可以在云平台配置出满足游戏开发者所需的针对一种或者多种游戏的推理服务,从而无需云服务提供商进行推理服务的专项化设计,并且,也有效降低中小型游戏厂商应用AI技术获得游戏推理结果的难度。此外,还提供了相应的装置及相关设备。
-
-
-