-
公开(公告)号:CN115564022A
公开(公告)日:2023-01-03
申请号:CN202211173639.0
申请日:2022-09-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种弹性调节算力的预测方法和装置,通过计算平台执行,该计算平台部署有经过训练的神经网络模型,神经网络模型包括n个子网络,n>2,方法包括:接收预测请求,其中包括待测样本;确定针对所述预测请求分配的算力系数,该算力系数指示,为所述预测请求分配的硬件算力资源与所述神经网络模型全部在所述计算平台运行时所需的总硬件算力资源的比例;根据所述算力系数,确定本次使用的n个子网络中的k个子网络;将所述待测样本输入所述k个子网络,得到预测结果。算力的可弹性伸缩的档位多,弹性调节算力的空间大。
-
公开(公告)号:CN116011593B
公开(公告)日:2023-06-16
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
公开(公告)号:CN116011593A
公开(公告)日:2023-04-25
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
公开(公告)号:CN115392957A
公开(公告)日:2022-11-25
申请号:CN202210968175.6
申请日:2022-08-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型训练中的注意力图的生成方法、装置以及设备。通过获取所述事件序列所对应的特征矩阵;确定所述事件序列中所包含的第i个事件所对应的第一时间向量x,确定所述事件序列中所包含的第j个事件所对应的第二时间向量x’;根据预设的时态内核、所述第一时间向量x和所述第二时间向量x’确定时间注意力权重矩阵kt;采用预设的事件内核确定所述事件键矩阵Ke和事件查询矩阵Qe所对应的事件注意力权重矩阵ke;融合所述时间注意力权重矩阵kt和所述事件注意力权重矩阵ke生成总注意力权重矩阵;根据所述总注意力权重矩阵和所述事件值矩阵Ve生成注意力图,从而体现出各事件的绝对时间和相对时间在相关性上的贡献。
-
-
-