-
公开(公告)号:CN119692417A
公开(公告)日:2025-03-25
申请号:CN202311607988.3
申请日:2023-11-27
Applicant: 华为云计算技术有限公司
IPC: G06N3/084 , G06N3/092 , G06N3/0499 , G06N3/0464 , G06N3/045
Abstract: 本申请提供了一种模型训练的方法、装置以及计算设备,该方法包括:接收用户输入的第一模型的配置参数的多个取值,该第一模型的配置参数包括该第一模型的训练参数和/或模型参数;根据第二模型预测得到该配置参数的多个取值分别对应的该第一模型的多个训练指标数据,该第一模型的训练指标数据包括该第一模型的训练过程数据和/或服务器训练该第一模型所消耗的硬件指标数据;从第一模型的多个训练指标数据中确定目标训练指标数据,并将该配置参数的多个取值中与该目标训练指标数据对应的目标取值发送给该用户;接收该用户确认的该目标取值,并基于该目标取值对该第一模型进行训练。该方法可以提高模型的训练速度和训练效率。