-
公开(公告)号:CN119938260A
公开(公告)日:2025-05-06
申请号:CN202411848420.5
申请日:2024-12-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F9/48
Abstract: 本申请公开了一种断点续训方法及装置、设备、存储介质、程序产品;所述方法包括:接收用户端发送的模型训练参数,基于所述模型训练参数和资源参数计算断点保存的第一步长;向所述用户端发送所述第一步长,接收所述客户端发送的第二步长,所述第二步长基于所述第一步长确定。
-
公开(公告)号:CN119512749A
公开(公告)日:2025-02-25
申请号:CN202411590301.4
申请日:2024-11-08
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F9/50 , G06F18/214 , G06N3/098
Abstract: 本发明公开了一种全局模型的并行训练方法、装置、设备、介质和产品,对各个计算节点进行分组,得到若干个计算小组;采用异步策略对每一所述计算小组内的计算节点进行训练,以更新每一所述计算小组对应的局部模型;在所有所述计算小组中确定落后小组,并加入落后组群中;当所述落后组群中的落后小组的数量达到预设的第一阈值时,分别计算每一所述落后小组的训练精度,并计算所述落后组群的训练精度均值,记为第一训练精度均值;根据训练精度超过所述第一训练精度均值的落后小组和其他非落后小组的局部模型参数,对全局模型的模型参数进行更新。采用本发明,改进了全局模型的参数更新条件和更新手段,实现模型训练精度和模型更新间隔之间的平衡。
-