-
公开(公告)号:CN119829285A
公开(公告)日:2025-04-15
申请号:CN202411899717.4
申请日:2024-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于确定模型训练的分片策略的方法和相关装置,模型可通过多种分片策略进行训练。该方法首先确定多个处理器在训练模型的过程中的运算时间,其中多个处理器可以根据分片策略进行划分,分片策略指示模型的数据在多个处理器中的划分方式。然后,基于分片策略,确定多个处理器在训练模型的过程中的通信时间。进一步,选择运算时间和通信时间中的较大者,并在该较大者满足时间条件时确定分片策略为多个分片策略中的目标分片策略。