-
公开(公告)号:CN118981385A
公开(公告)日:2024-11-19
申请号:CN202410987881.4
申请日:2024-07-23
Applicant: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据处理方法、装置、电子设备、存储介质及程序产品,属于数据处理技术领域,用以降低显存占用,提供数据处理效率。所述方法包括:确定用于处理待处理数据的目标专家模型;通过第一内存的共享权重和第二内存的目标低秩矩阵构造所述目标专家模型,所述目标低秩矩阵为预先对所述目标专家模型进行分解得到的;通过所述目标专家模型处理所述待处理数据。
-
公开(公告)号:CN119026663A
公开(公告)日:2024-11-26
申请号:CN202411107391.7
申请日:2024-08-13
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06N3/082
Abstract: 本发明提供一种单次网络剪枝方法、装置、设备、介质及产品,方法包括:获取单个网络层中权重矩阵对应的剪枝掩码矩阵;将权重矩阵中第一列确定为当前剪枝列;基于剪枝掩码矩阵,对当前剪枝列的权重进行修剪;基于当前剪枝列中已修剪的权重,确定权重矩阵中待更新列的待更新权重;基于海森矩阵的逆矩阵,对待更新权重进行更新;将当前剪枝列的下一列确定为当前剪枝列,并迭代执行权重修剪和权重更新的步骤,直至当前剪枝列为倒数第二列;基于剪枝掩码矩阵,对权重矩阵中最后一列的权重进行修剪,以获得网络层剪枝后的权重矩阵。本发明提供的单次网络剪枝方法,降低了算法的计算复杂度,从而减少计算资源和时间的成本,有效提高单次网络剪枝的效率。
-