-
公开(公告)号:CN114207579A
公开(公告)日:2022-03-18
申请号:CN202080055428.X
申请日:2020-06-10
Applicant: 微软技术许可有限责任公司
Abstract: 本文描述了一种使用硬件加速器加快深度神经网络(DNN)操作或其他处理操作的计算系统。硬件加速器进而包括结合标量处理单元(SPU)工作的张量处理引擎。张量处理引擎处置DNN所需的各种基于张量的操作,诸如将向量乘以矩阵、将向量与其他向量组合、变换个体向量等。SPU执行基于标量的操作,诸如形成标量的倒数、生成标量的平方根等。根据一个说明性实现,计算系统使用相同的基于向量的编程接口来与张量处理引擎和SPU二者交互。
-
公开(公告)号:CN110678841A
公开(公告)日:2020-01-10
申请号:CN201880034189.2
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 公开了一种具有高效指令集的硬件加速器。一种装置可以包括被配置为访问第一机器指令和第二机器指令的逻辑。第二机器指令可以缺失执行第二机器指令所需要的张量操作数。该逻辑还可以被配置为执行第一机器指令,从而产生张量。该逻辑还可以被配置为使用结果张量作为缺失张量操作数来执行第二机器指令。
-
公开(公告)号:CN116171431A
公开(公告)日:2023-05-26
申请号:CN202180055367.1
申请日:2021-05-06
Applicant: 微软技术许可有限责任公司
IPC: G06F12/06
Abstract: 本公开涉及用于将存储体式存储器结构与加速器一起使用的设备和方法。这些设备和方法可以对加速器的数据路径和存储器中的数据流进行分段和隔离。这些设备和方法可以为每个数据通道提供其自己的寄存器存储器库。这些设备和方法可以使用存储器地址解码器来将局部变量放置在适当的存储器库中。
-
公开(公告)号:CN110692038A
公开(公告)日:2020-01-14
申请号:CN201880033692.6
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 提供了一种处理器电路,该处理器电路包括:输入端子和输出端子;多个矢量处理器操作电路;耦合到输入端子、输出端子和每个矢量处理器操作电路的选择器电路;以及调度器电路,适于控制选择器电路以在输入端子与输出端子之间配置以任何顺序包括零个、一个或多个矢量处理器操作电路的矢量处理流水线。
-
公开(公告)号:CN116848531A
公开(公告)日:2023-10-03
申请号:CN202280012691.X
申请日:2022-01-14
Applicant: 微软技术许可有限责任公司
Abstract: 本公开涉及一种用于使用针对固定功能数据路径的可配置堆叠架构的设备,其具有用于加速深度神经网络(DNN)的运算或层的加速器。堆叠架构可以具有固定功能数据路径,该固定功能数据路径包括一个或多个可配置微执行单元,该一个或多个可配置微执行单元执行针对DNN层运算的一系列向量、标量、归约、广播和归一化运算。固定功能数据路径可以基于DNN或运算进行定制。
-
公开(公告)号:CN110678840B
公开(公告)日:2023-08-15
申请号:CN201880034185.4
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 公开了硬件加速器中的张量寄存器文件。一种装置可以包括各自被配置为执行一种类型的张量运算的张量运算计算器。该装置还可以包括张量寄存器文件,张量寄存器文件中的每个张量寄存器文件与张量运算计算器之一相关联。该装置还可以包括逻辑,该逻辑被配置为根据要对张量中的相应张量执行的张量运算的类型,来将该相应张量存储在多个张量寄存器文件中。该装置还可以基于机器指令要执行的张量运算的类型,来控制对张量寄存器文件的读取访问。
-
公开(公告)号:CN110692038B
公开(公告)日:2023-04-04
申请号:CN201880033692.6
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 提供了一种处理器电路,该处理器电路包括:输入端子和输出端子;多个矢量处理器操作电路;耦合到输入端子、输出端子和每个矢量处理器操作电路的选择器电路;以及调度器电路,适于控制选择器电路以在输入端子与输出端子之间配置以任何顺序包括零个、一个或多个矢量处理器操作电路的矢量处理流水线。
-
公开(公告)号:CN110678841B
公开(公告)日:2023-07-14
申请号:CN201880034189.2
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 公开了一种具有高效指令集的硬件加速器。一种装置可以包括被配置为访问第一机器指令和第二机器指令的逻辑。第二机器指令可以缺失执行第二机器指令所需要的张量操作数。该逻辑还可以被配置为执行第一机器指令,从而产生张量。该逻辑还可以被配置为使用结果张量作为缺失张量操作数来执行第二机器指令。
-
公开(公告)号:CN115398395A
公开(公告)日:2022-11-25
申请号:CN202180026885.0
申请日:2021-02-15
Applicant: 微软技术许可有限责任公司
IPC: G06F9/38
Abstract: 描述了具有独立数据路径的深度神经网络加速器(DNN)和相关方法,数据路径用于同时处理不同类运算。示例DNN加速器包括用于接收指令链的指令调度器,该指令链具有用于执行与神经网络模型相对应的第一类运算和第二类运算的指令。DNN加速器还包括第一数据路径和第二数据路径,其中每个数据路径被配置为在输出任何结果之前在本地执行至少一个指令链。指令调度器被配置为将用于执行第一类运算的指令转发到第一数据路径并且将用于执行第二类运算的指令转发到第二数据路径,以在时间上将第一类运算的至少一个子集的执行与第二类运算的至少一个子集的执行重叠。
-
公开(公告)号:CN110678840A
公开(公告)日:2020-01-10
申请号:CN201880034185.4
申请日:2018-04-24
Applicant: 微软技术许可有限责任公司
Abstract: 公开了硬件加速器中的张量寄存器文件。一种装置可以包括各自被配置为执行一种类型的张量运算的张量运算计算器。该装置还可以包括张量寄存器文件,张量寄存器文件中的每个张量寄存器文件与张量运算计算器之一相关联。该装置还可以包括逻辑,该逻辑被配置为根据要对张量中的相应张量执行的张量运算的类型,来将该相应张量存储在多个张量寄存器文件中。该装置还可以基于机器指令要执行的张量运算的类型,来控制对张量寄存器文件的读取访问。
-
-
-
-
-
-
-
-
-