用于加速指数函数的计算的系统和方法

    公开(公告)号:CN117897688A

    公开(公告)日:2024-04-16

    申请号:CN202280058822.8

    申请日:2022-08-03

    Abstract: 本公开的实施例的各方面涉及现场可编程门阵列(FPGA),FPGA被配置为实现指数函数数据路径,指数函数数据路径包括:输入缩放级,包括常数移位器和整数加法器,用于将输入浮点值的尾数部分缩放近似log2e来计算缩放后的尾数值,其中e是欧拉数;指数级,包括桶形移位器和指数查找表,用于:基于输入浮点值的指数部分从缩放后的尾数值中提取整数部分和小数部分;将偏置移位应用于整数部分以计算结果浮点值的结果指数部分;基于小数部分在指数查找表中查找结果浮点值的结果尾数部分;以及组合结果指数部分和结果尾数部分以生成结果浮点值。

    分层和共享指数浮点数据类型
    3.
    发明公开

    公开(公告)号:CN116830077A

    公开(公告)日:2023-09-29

    申请号:CN202280014048.0

    申请日:2022-01-20

    Abstract: 本公开的实施例包括用于提供分层和共享指数浮点数据类型的系统和方法。第一共享指数值和第二共享指数值基于多个浮点值的指数值而被确定。第三共享指数值基于第一共享指数值和第二共享指数值而被确定。第一差值和第二差值基于第一共享指数值、第二共享指数值和第三共享指数值而被确定。符号值和尾数值针对多个浮点值而被确定。针对多个浮点值中的每个浮点值的符号值和尾数值、第三共享指数值、第一差值和第二差值被存储在针对共享指数浮点数据类型的数据结构中。

    用于深度神经网络的稀疏和量化
    6.
    发明公开

    公开(公告)号:CN118871927A

    公开(公告)日:2024-10-29

    申请号:CN202380026818.8

    申请日:2023-01-17

    Abstract: 一种计算系统被配置为实现深度神经网络,深度神经网络包括用于接收应用于深度神经网络的输入的输入层、用于基于所接收的输入来输出推理的输出层、以及插入在输入层和输出层之间的多个隐藏层。多个节点选择性地对输入进行操作,以生成并且引起推理的输出,其中节点的操作是基于深度神经网络的参数而被控制。稀疏控制器被配置为选择性地应用多个不同的稀疏状态来控制深度神经网络的参数密度。量化控制器被配置成以稀疏依赖的方式选择性地量化深度神经网的参数,使得应用于每个参数的量化基于多个不同稀疏状态中的哪个稀疏状态应用于该参数。

    用于数据掩码的硬件加速的系统和方法

    公开(公告)号:CN118339771A

    公开(公告)日:2024-07-12

    申请号:CN202280079216.4

    申请日:2022-09-19

    Abstract: 一种现场可编程门阵列FPGA,包括连接多个逻辑块的可配置互连结构,该可配置互连结构和逻辑块被配置为实现数据掩码电路,该数据掩码电路被配置为:接收输入数据(362),该输入数据包括输入数据在多个索引处的数据值;使用掩码多路复用器(365)在数据值中的数据值和替代值之间进行选择以生成所掩码的数据(330),该掩码多路复用器由在与输入数据的索引相对应的索引处的多个掩码值(SIMD)中的掩码值控制;以及输出所掩码的数据。在一些示例中,该可配置互连结构和逻辑块还被配置为实现被配置为生成掩码值的掩码生成电路。在一些示例中,掩码值是从外部存储器接收的。

    具有包括多端口存储器的向量寄存器文件的矩阵向量乘法器

    公开(公告)号:CN112005214B

    公开(公告)日:2024-02-20

    申请号:CN201980026843.X

    申请日:2019-04-06

    Abstract: 提供了神经网络处理器和相关方法,神经网络处理器包括向量寄存器文件(VRF),向量寄存器文件(VRF)具有多端口存储器。处理器可以包括瓦片,以对数据元素的N乘N矩阵和数据元素的N乘1向量进行处理。VRF可以响应于写入指令,将N个数据元素存储在多端口存储器中,并且在P个时钟周期中的每个时钟周期期间,向多端口存储器的P个输入接口电路中的每个输入接口电路提供N个数据元素,输入接口电路包括输入通道,输入通道被配置为并行承载L个数据元素。在P个时钟周期中的每个时钟周期期间,多端口存储器可以被配置为经由P个输入接口电路中所选择的至少一个输入接口电路来接收N个数据元素。VRF可以包括输出接口电路,输出接口电路用于响应于读取指令而提供N个数据元素。

    具有包括多端口存储器的向量寄存器文件的矩阵向量乘法器

    公开(公告)号:CN112005214A

    公开(公告)日:2020-11-27

    申请号:CN201980026843.X

    申请日:2019-04-06

    Abstract: 提供了神经网络处理器和相关方法,神经网络处理器包括向量寄存器文件(VRF),向量寄存器文件(VRF)具有多端口存储器。处理器可以包括瓦片,以对数据元素的N乘N矩阵和数据元素的N乘1向量进行处理。VRF可以响应于写入指令,将N个数据元素存储在多端口存储器中,并且在P个时钟周期中的每个时钟周期期间,向多端口存储器的P个输入接口电路中的每个输入接口电路提供N个数据元素,输入接口电路包括输入通道,输入通道被配置为并行承载L个数据元素。在P个时钟周期中的每个时钟周期期间,多端口存储器可以被配置为经由P个输入接口电路中所选择的至少一个输入接口电路来接收N个数据元素。VRF可以包括输出接口电路,输出接口电路用于响应于读取指令而提供N个数据元素。

Patent Agency Ranking