溢出感知的量化模型训练方法、装置、介质及终端设备

    公开(公告)号:CN113780549A

    公开(公告)日:2021-12-10

    申请号:CN202110898412.1

    申请日:2021-08-05

    Abstract: 本申请公开了一种溢出感知的量化模型训练方法、装置、介质及终端设备,所述方法包括对预设网络模型中的网络层的目标数据进行量化处理,并基于量化处理后的目标数据以及网络层,确定网络层的输出数据,确定输出数据对应的溢出元素数量,并基于所述溢出元素数量调节所述网络层对应的量化缩放系数,以调节所述网络层对应的量化缩放因子。本实施例通过基于用于运行所述网络层的累加器的约束位数来对量化缩放系数及量化缩放因子进行调整,从而使得网络层的输出数据不会出现溢出的问题,进而可以提高模型性能,同时可以使得网络层在低约束位数的累加器中进行,从而可以增加用于运行网络层的累加器的并行数量,从而可以提高网络层的运算速度。

Patent Agency Ranking