用于密集和稀疏矩阵计算的加速器

    公开(公告)号:CN115023685A

    公开(公告)日:2022-09-06

    申请号:CN202180011738.6

    申请日:2021-01-20

    Abstract: 一种增加矩阵计算的计算机硬件效率的方法。方法包括在计算机处理机器处接收对矩阵计算的一个或多个运算进行编码的数字信号,每个运算包括一个或多个操作数。方法还包括:响应于由计算机处理机器的稀疏数据检查设备确定矩阵计算的运算包括所有密集操作数,将该运算转发给计算机处理机器的密集计算设备,密集计算设备被配置为基于密集操作数来执行矩阵计算的运算。方法还包括:响应于由稀疏数据检查设备确定矩阵计算的运算包括一个或多个稀疏操作数,将该运算转发给稀疏计算设备,稀疏计算设备被配置为执行矩阵计算的运算。

    因指令集而异的执行隔离

    公开(公告)号:CN105247494A

    公开(公告)日:2016-01-13

    申请号:CN201480025867.0

    申请日:2014-05-05

    CPC classification number: G06F12/1458 G06F12/1009 G06F12/145

    Abstract: 芯片上的系统(SoC)或其他集成系统可包括第一处理器和共享页表的至少一个附加处理器。该共享的页表可包括许可比特,这些许可比特包括支持该处理器的第一许可指示符和支持至少一个附加处理器中的至少一个的第二许可指示符。在一个实现中,该页表可包括至少一个附加比特以适应支持该至少一个附加处理器的编码。当处理器之一存取处理器时,执行一种方法,在该方法中,共享的页表被访问并且(诸)许可指示符的值被从页表中读出以确定用于执行某些动作的许可,这些动作包括执行页;对页的读/写;或与页有关的内核模式。

    集成电路存储器分配方法、装置、介质以及系统

    公开(公告)号:CN105144106B

    公开(公告)日:2020-05-05

    申请号:CN201480006767.3

    申请日:2014-01-29

    Abstract: 一种用于操作计算设备的方法包括基于工作负载或来自不同类型的应用的请求来动态管理至少两种类型的存储器。第一类型的存储器可以是高性能存储器,它相比于计算设备中的第二类型的存储器而言可具有更高带宽、更低存储器等待时间和/或更低的功耗。在一个实施例中,计算设备包括片上系统(SoC),其包括与一个或多个处理器核一起定位的宽I/O DRAM。低功率双数据速率3动态随机存取存储器(LPDDR3 DRAM)存储器外部地连接到SoC或是SoC的嵌入部分。在各实施例中,计算设备至少可以被包括在蜂窝电话、移动设备、嵌入式系统、视频游戏、媒体控制台、膝上型计算机、台式计算机、服务器和/或数据中心中。

    用于语言模型的压缩和解压缩数据

    公开(公告)号:CN116235187A

    公开(公告)日:2023-06-06

    申请号:CN202180052316.3

    申请日:2021-05-18

    Abstract: 本公开的实施例包括用于压缩和解压缩由神经网络中的子块生成的数据的系统和方法。在一些实施例中,在神经网络中的压缩块处接收输入矩阵。压缩块将输入矩阵压缩为经压缩的矩阵并且输出经压缩的矩阵。相对于输入矩阵的维数经压缩的矩阵具有减少的维数。解压缩块取回经压缩的矩阵。解压缩块将经压缩的矩阵解压缩为经解压缩的矩阵并且输出经解压缩的矩阵。经解压缩的矩阵具有与输入矩阵的维数相同的维数。压缩块和解压缩块基于从神经网络接收的反馈被优化。

    异类存储器的动态管理
    9.
    发明公开

    公开(公告)号:CN105144106A

    公开(公告)日:2015-12-09

    申请号:CN201480006767.3

    申请日:2014-01-29

    Abstract: 一种用于操作计算设备的方法包括基于工作负载或来自不同类型的应用的请求来动态管理至少两种类型的存储器。第一类型的存储器可以是高性能存储器,它相比于计算设备中的第二类型的存储器而言可具有更高带宽、更低存储器等待时间和/或更低的功耗。在一个实施例中,计算设备包括片上系统(SoC),其包括与一个或多个处理器核一起定位的宽I/O DRAM。低功率双数据速率3动态随机存取存储器(LPDDR3 DRAM)存储器外部地连接到SoC或是SoC的嵌入部分。在各实施例中,计算设备至少可以被包括在蜂窝电话、移动设备、嵌入式系统、视频游戏、媒体控制台、膝上型计算机、台式计算机、服务器和/或数据中心中。

    基于用于转换器模型的位置压缩标记

    公开(公告)号:CN116157802A

    公开(公告)日:2023-05-23

    申请号:CN202180059885.0

    申请日:2021-05-27

    Abstract: 本公开的实施例包括用于基于训练数据的位置来压缩标记的系统和方法,该训练数据被用于训练转换器模型。在一些实施例中,用于训练转换器模型的输入数据集合被接收。该输入数据集合包括标记集合和位置值集合。标记集合中的第一标记被标识,第一标记与标记集合中的第二标记相同。表示第一标记的位置值与表示第二标记的位置值被组合。通过从标记集合中移除第一标记来修改该标记集合。训练数据被生成,以包括经修改的标记集合和位置值集合。使用训练数据集合来训练转换器模型。

Patent Agency Ranking