-
公开(公告)号:CN117195966A
公开(公告)日:2023-12-08
申请号:CN202311151371.5
申请日:2023-09-07
Applicant: 浙江大学
IPC: G06N3/0464 , H04L67/10 , G06N3/082 , G06N3/084
Abstract: 本发明公开了一种基于深度神经网络的云边协同推理加速方法及系统,该方法运行于云边端层次上,包含离线阶段和在线阶段:离线阶段负责对模型进行两步剪枝优化和层延迟计算;在线阶段对模型进行评估和模型分割优化;其中在线推理评估阶段涉及传输时延与推理时延间的平衡问题,通过各层推理延迟模型的配置、运行时的网络带宽条件、云计算容量等当前运行时环境参数,决策出模型的最佳分割位置,实现在保证模型一定准确率的前提下,最小化云边协同推理时延、提高了推理的效率,同时提升边缘服务器的计算资源利用率。