-
公开(公告)号:CN119514632A
公开(公告)日:2025-02-25
申请号:CN202311393706.4
申请日:2023-10-25
Applicant: 华为云计算技术有限公司
IPC: G06N3/082
Abstract: 本申请公开了一种网络模型的训练方法、云平台及相关装置,属于人工智能技术领域。所述方法包括:提供参数配置界面,从该参数配置界面中获取目标网络模型的参数量和类型,基于该目标网络模型的参数量和类型,确定目标网络模型的训练配置信息,该目标网络模型的训练过程被划分为多个训练阶段,不同训练阶段对应的模型参数量不同,且该多个训练阶段的模型参数量按照训练先后顺序依次递增,该训练配置信息包括多个训练阶段的配置信息,按照该多个训练阶段的配置信息,对目标网络模型进行训练。这样,能够实现对网络模型训练的分阶段精细控制,还能够有效加快网络模型的收敛速度,节约网络模型训练所需的计算量,降低网络模型训练成本。