模型量化方法、装置、电子设备及存储介质

    公开(公告)号:CN114444808A

    公开(公告)日:2022-05-06

    申请号:CN202210121710.4

    申请日:2022-02-09

    Abstract: 本公开关于一种模型量化方法、装置、电子设备及存储介质,该方法包括:获取量化模型集合;所述量化模型集合包括至少两个量化模型;所述量化模型为对待量化模型中的至少一个目标网络层进行量化得到的;确定各所述量化模型对应的适应度;所述适应度用于表征所述量化模型的性能提升;所述量化模型的性能提升为根据所述量化模型的模型性能和预设模型的模型性能间的差异确定的;所述预设模型为对所述待量化模型中的每个网络层都进行量化得到的;所述模型性能包括模型速度和模型精度;按照各所述量化模型对应的适应度,对各所述量化模型对应的量化策略参数进行遗传算法优化,得到目标量化模型。采用本公开可以提高神经网络模型的量化效果。

Patent Agency Ranking