-
公开(公告)号:CN117371517A
公开(公告)日:2024-01-09
申请号:CN202311367619.1
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0985 , G06N3/084 , G06F18/214 , G06V10/774 , G06T1/20
Abstract: 本说明书提供一种深度学习模型的元学习方法以及深度学习模型的元学习系统,涉及深度学习技术领域。该深度学习模型的元学习方法应用于包括N个处理节点的集群,其中,该方法包括:获得训练数据集,上述训练数据集包括多个任务对应的训练样本;以及,通过上述集群中的N个处理节点并行地基于上述训练数据集对上述深度学习模型进行多次迭代训练,得到该深度学习模型的元学习参数。其中,在每次迭代训练中,上述N个处理节点中的每个处理节点使用训练数据集中的部分训练样本学习该深度学习模型的部分参数,上述部分训练样本对应于同一任务。
-
公开(公告)号:CN119829285A
公开(公告)日:2025-04-15
申请号:CN202411899717.4
申请日:2024-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于确定模型训练的分片策略的方法和相关装置,模型可通过多种分片策略进行训练。该方法首先确定多个处理器在训练模型的过程中的运算时间,其中多个处理器可以根据分片策略进行划分,分片策略指示模型的数据在多个处理器中的划分方式。然后,基于分片策略,确定多个处理器在训练模型的过程中的通信时间。进一步,选择运算时间和通信时间中的较大者,并在该较大者满足时间条件时确定分片策略为多个分片策略中的目标分片策略。
-