-
公开(公告)号:CN111340121B
公开(公告)日:2022-04-12
申请号:CN202010131566.3
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提供一种目标特征的确定方法,该方法包括:先获取原始样本集,其中每个原始样本包括业务对象的样本标签和多个原始特征;再基于原始样本集,进行多轮迭代,将迭代结束得到的多个当前特征,确定为该业务对象的目标特征,该多个当前特征初始为所述多个原始特征。其中任意一轮的迭代包括:先基于当前样本集,建立树模型,其中每个当前样本包括该样本标签和该多个当前特征;接着,根据树模型中各条预测路径上任意数量的父节点所对应的分裂特征,确定出特征组合集,并从中选取预测能力较优的多个优选特征组合;再利用多个预定义算子,对各个优选特征组合中包含的特征进行融合处理,得到多个新生特征,进而更新上述多个当前特征。
-
公开(公告)号:CN111340121A
公开(公告)日:2020-06-26
申请号:CN202010131566.3
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提供一种目标特征的确定方法,该方法包括:先获取原始样本集,其中每个原始样本包括业务对象的样本标签和多个原始特征;再基于原始样本集,进行多轮迭代,将迭代结束得到的多个当前特征,确定为该业务对象的目标特征,该多个当前特征初始为所述多个原始特征。其中任意一轮的迭代包括:先基于当前样本集,建立树模型,其中每个当前样本包括该样本标签和该多个当前特征;接着,根据树模型中各条预测路径上任意数量的父节点所对应的分裂特征,确定出特征组合集,并从中选取预测能力较优的多个优选特征组合;再利用多个预定义算子,对各个优选特征组合中包含的特征进行融合处理,得到多个新生特征,进而更新上述多个当前特征。
-
公开(公告)号:CN115861681A
公开(公告)日:2023-03-28
申请号:CN202211422452.X
申请日:2022-11-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/09
Abstract: 本说明书实施例公开了一种模型的元学习方法、装置以及设备。方案包括通过获取包含M个样本的集合;针对第i个样本Si,生成对应于所述训练样本的嵌入向量φi和中间特征图ηi;根据所产生的M个嵌入向量的平均值τc生成维度注意力图Md,和,根据所产生的M个中间特征图的平均值τη生成区域注意力图Mr;融合所述嵌入向量φi和维度注意力图Md生成维度特征向量φi’,以及,融合所述第i个样本的中间特征图ηi和所述区域注意力图Mr生成区域特征图ηi’;根据所述维度特征向量φi’和所述区域特征图ηi’进行训练。从而实现在元学习中,通过从维度和区域这两个不同的角度上来精确定位任务所需要的特征,减少无关特征的干扰。
-
公开(公告)号:CN119922239A
公开(公告)日:2025-05-02
申请号:CN202510080646.3
申请日:2025-01-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L67/60 , G06Q30/0251 , G06Q30/0241
Abstract: 本说明书实施例提供一种针对非平稳请求的在线分配方法和装置,方法包括:获取当前在线分配的预设参数;将n个在线请求对应的总时长分成T个时段,每个时段分割为探索阶段和利用阶段;在探索阶段,基于历史数据计算的当前时段的资源先验分配向量和预设参数,对当前时段的前N0个在线请求进行决策,同时收集该阶段的N0个在线请求样本;在利用阶段,基于收集到的N0个在线请求样本,计算当前时段的资源后验分配向量,同时根据当前时段之前的各个时段的累积资源和估计的累积资源,对当前时段的资源后验分配向量进行更新,得到目标资源分配向量,基于目标资源分配向量和预设参数对剩余的在线请求进行决策。
-
公开(公告)号:CN118246505A
公开(公告)日:2024-06-25
申请号:CN202410089426.2
申请日:2024-01-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0442 , G06N3/042 , G06N3/045 , G06N3/096 , G06N3/0499 , G06N3/084
Abstract: 本说明书实施例提供一种大语言模型的训练方法及装置,以及一种预测模型的训练方法及装置。其中大语言模型的训练方法包括:首先,将训练样本的样本特征输入大语言模型,得到对应的预测结果;该训练样本包括自然语言文本,大语言模型包括混合专家神经网络MoE,所述MoE网络包括门控网络和多个专家网络。接着,基于所述预测结果和所述训练样本的样本标签,确定任务损失项;以及,基于所述多个专家网络对应的多个输出,确定蒸馏损失项;所述多个专家网络之间互为蒸馏学习中的学生和老师。之后,基于所述任务损失项和蒸馏损失项,训练所述大语言模型。
-
-
-
-