-
公开(公告)号:CN118378099A
公开(公告)日:2024-07-23
申请号:CN202410612144.6
申请日:2024-05-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对自然语言处理模型的数据召回方法及装置,针对待通过自然语言模型处理的第一信息,可以对其进行数据召回的预处理,以将召回的文本与第一信息一起经由自然语言处理模型进行处理,得到相应业务处理结果。在数据召回过程中,可以先从数据库中检索与第一信息相匹配的若干文本作为候选文本,然后利用预先训练的效用模型对各个候选文本进行有效性评估,以得到各个候选文本分别对应的各个效用分数,再针对各个候选文本,分别基于相应相似度和效用分数的融合得到相应的融合分数,并根据各个融合分数从候选文本中筛选出目标文本作为召回数据。如此,可以有效节约计算成本。
-
公开(公告)号:CN119829285A
公开(公告)日:2025-04-15
申请号:CN202411899717.4
申请日:2024-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于确定模型训练的分片策略的方法和相关装置,模型可通过多种分片策略进行训练。该方法首先确定多个处理器在训练模型的过程中的运算时间,其中多个处理器可以根据分片策略进行划分,分片策略指示模型的数据在多个处理器中的划分方式。然后,基于分片策略,确定多个处理器在训练模型的过程中的通信时间。进一步,选择运算时间和通信时间中的较大者,并在该较大者满足时间条件时确定分片策略为多个分片策略中的目标分片策略。
-
公开(公告)号:CN117371517A
公开(公告)日:2024-01-09
申请号:CN202311367619.1
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0985 , G06N3/084 , G06F18/214 , G06V10/774 , G06T1/20
Abstract: 本说明书提供一种深度学习模型的元学习方法以及深度学习模型的元学习系统,涉及深度学习技术领域。该深度学习模型的元学习方法应用于包括N个处理节点的集群,其中,该方法包括:获得训练数据集,上述训练数据集包括多个任务对应的训练样本;以及,通过上述集群中的N个处理节点并行地基于上述训练数据集对上述深度学习模型进行多次迭代训练,得到该深度学习模型的元学习参数。其中,在每次迭代训练中,上述N个处理节点中的每个处理节点使用训练数据集中的部分训练样本学习该深度学习模型的部分参数,上述部分训练样本对应于同一任务。
-
-