-
公开(公告)号:CN116011593A
公开(公告)日:2023-04-25
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
公开(公告)号:CN115392957A
公开(公告)日:2022-11-25
申请号:CN202210968175.6
申请日:2022-08-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型训练中的注意力图的生成方法、装置以及设备。通过获取所述事件序列所对应的特征矩阵;确定所述事件序列中所包含的第i个事件所对应的第一时间向量x,确定所述事件序列中所包含的第j个事件所对应的第二时间向量x’;根据预设的时态内核、所述第一时间向量x和所述第二时间向量x’确定时间注意力权重矩阵kt;采用预设的事件内核确定所述事件键矩阵Ke和事件查询矩阵Qe所对应的事件注意力权重矩阵ke;融合所述时间注意力权重矩阵kt和所述事件注意力权重矩阵ke生成总注意力权重矩阵;根据所述总注意力权重矩阵和所述事件值矩阵Ve生成注意力图,从而体现出各事件的绝对时间和相对时间在相关性上的贡献。
-