一种神经网络数据压缩装置和方法

    公开(公告)号:CN119250134A

    公开(公告)日:2025-01-03

    申请号:CN202411226583.X

    申请日:2024-09-03

    Abstract: 本发明提供了一种人工神经网络数据压缩装置和方法,浮点数据采集模块用于获取人工神经网络的浮点数据;浮点数据存储模块用于存储以共享指数浮点格式存在的浮点数据;浮点数据运算模块用于将以共享指数浮点格式存在的浮点数据进行人工神经网络正向运算;其中,所述共享指数浮点格式具体是将n个浮点数据编码为一个块,块中的每个数据由E、S和M三部分组成,分别代表指数、符号和尾数部分,根据E和共享指数Es之间的差异edif向右移位。该装置能够利用共享指数实现高数据压缩率,同时在低精度格式上保持良好的DNN模型精度,并且比现有的低精度浮点格式更适合端侧设备的乘积电路实现。

Patent Agency Ranking