针对神经网络算子融合的端云协同推理方法及装置

    公开(公告)号:CN115062784A

    公开(公告)日:2022-09-16

    申请号:CN202210666123.3

    申请日:2022-06-13

    Abstract: 本发明公开一种针对神经网络算子融合的端云协同推理方法及装置,所述方法包括将神经网络转换为有向无环图;将所述有向无环图切分为若干链式结构;对每一链式结构中的所述网络层进行融合操作,并使用得到的融合块替代被融合的网络层;依据待推理数据,预测每一融合块与每一未融合网络层的推理时间与输出数据大小,并根据所述输出数据大小与端云之间的网络带宽,计算中间数据传输时间;基于所述推理时间与所述中间数据传输时间,切分所述神经网络,并基于切分结果进行端云协同推理。本发明解决了具有可融合算子的网络模型的最小时延问题。

    一种边缘异构场景中的端云协同推理方法和系统

    公开(公告)号:CN115048218A

    公开(公告)日:2022-09-13

    申请号:CN202210650520.1

    申请日:2022-06-09

    Abstract: 本发明公开了一种边缘异构场景中的端云协同推理方法和系统。该方法包括离线和在线的两个阶段。在离线阶段,得到各个节点CPU以及内存占用率与神经网络每层推理时间的逻辑回归函数。在线阶段动态获取CPU与内存使用率,实时更新当前CPU和内存压力值下的神经网络各层的执行时间,根据此时间选择最佳模型划分点与最优节点,以达到最大的系统吞吐量。本发明公开了一种边缘异构场景中的端云协同推理框架的组成原理,可以确定异构边缘计算系统的最佳边缘设备和模型划分点,应用于图像分类检测系统,达到系统高吞吐量要求。

Patent Agency Ranking