-
公开(公告)号:CN115104108A
公开(公告)日:2022-09-23
申请号:CN202180013713.X
申请日:2021-03-05
Applicant: 华为云计算技术有限公司
Inventor: 阿明·巴尼塔莱比·德科迪 , 纳文·韦杜拉 , 张勇 , 王岚君
Abstract: 提供了用于将训练后的神经网络划分成用于在第一设备上执行的第一神经网络和用于在第二设备上执行的第二神经网络的系统和方法。执行所述划分,以在精度约束内优化以下操作的总体延迟:在所述第一设备上执行所述第一神经网络以基于输入数据生成特征图输出,将所述特征图输出从所述第一设备发送到所述第二设备,以及在所述第二设备上执行所述第二神经网络以基于所述第一设备的所述特征图输出生成推理输出。