-
公开(公告)号:CN115023685A
公开(公告)日:2022-09-06
申请号:CN202180011738.6
申请日:2021-01-20
Applicant: 微软技术许可有限责任公司
IPC: G06F9/30
Abstract: 一种增加矩阵计算的计算机硬件效率的方法。方法包括在计算机处理机器处接收对矩阵计算的一个或多个运算进行编码的数字信号,每个运算包括一个或多个操作数。方法还包括:响应于由计算机处理机器的稀疏数据检查设备确定矩阵计算的运算包括所有密集操作数,将该运算转发给计算机处理机器的密集计算设备,密集计算设备被配置为基于密集操作数来执行矩阵计算的运算。方法还包括:响应于由稀疏数据检查设备确定矩阵计算的运算包括一个或多个稀疏操作数,将该运算转发给稀疏计算设备,稀疏计算设备被配置为执行矩阵计算的运算。
-
公开(公告)号:CN115039109A
公开(公告)日:2022-09-09
申请号:CN202080094466.6
申请日:2020-12-16
Applicant: 微软技术许可有限责任公司
Inventor: B·普蒂佩迪 , M·梅斯马霍斯罗沙希 , 奚锦文 , S·M·库尔卡尼 , M·特伦布莱 , M·贝宁格 , N·克劳迪诺·佩雷拉·洛佩斯
Abstract: 本公开的实施例包括一种错误恢复方法,该错误恢复方法包括检测计算错误,重启处理数据集的多个人工智能处理器中的第一人工智能处理器,以及在人工智能处理器加载模型,其中该模型与在由多个人工智能处理器对来自数据集的数据的先前处理迭代期间由多个人工智能处理器处理的相同模型相对应。
-
公开(公告)号:CN105247494A
公开(公告)日:2016-01-13
申请号:CN201480025867.0
申请日:2014-05-05
Applicant: 微软技术许可有限责任公司
IPC: G06F12/1009 , G06F12/14
CPC classification number: G06F12/1458 , G06F12/1009 , G06F12/145
Abstract: 芯片上的系统(SoC)或其他集成系统可包括第一处理器和共享页表的至少一个附加处理器。该共享的页表可包括许可比特,这些许可比特包括支持该处理器的第一许可指示符和支持至少一个附加处理器中的至少一个的第二许可指示符。在一个实现中,该页表可包括至少一个附加比特以适应支持该至少一个附加处理器的编码。当处理器之一存取处理器时,执行一种方法,在该方法中,共享的页表被访问并且(诸)许可指示符的值被从页表中读出以确定用于执行某些动作的许可,这些动作包括执行页;对页的读/写;或与页有关的内核模式。
-
公开(公告)号:CN114127741A
公开(公告)日:2022-03-01
申请号:CN202080051365.0
申请日:2020-06-09
Applicant: 微软技术许可有限责任公司
Inventor: B·普蒂佩迪 , M·特伦布莱 , S·S·布哈拉德瓦杰 , 奚锦文 , M·梅斯马霍斯罗沙希
Abstract: 本文中所描述的方法、系统、装置和计算机程序产品支持大型AI模型在被通信地连接到参数服务器的存储器受限目标设备上的执行,该参数服务器存储AI模型的主副本。AI模型可以被分解成较小的部分(例如,层或子层),并且每个部分可以在目标设备上尽可能高效地执行。在AI模型的一部分的执行完成之后,可以在目标设备处下载并执行AI模型的另一部分。一次执行AI模型的一部分的该范例允许大型AI模型的动态执行。
-
公开(公告)号:CN105144106B
公开(公告)日:2020-05-05
申请号:CN201480006767.3
申请日:2014-01-29
Applicant: 微软技术许可有限责任公司
IPC: G06F9/50
Abstract: 一种用于操作计算设备的方法包括基于工作负载或来自不同类型的应用的请求来动态管理至少两种类型的存储器。第一类型的存储器可以是高性能存储器,它相比于计算设备中的第二类型的存储器而言可具有更高带宽、更低存储器等待时间和/或更低的功耗。在一个实施例中,计算设备包括片上系统(SoC),其包括与一个或多个处理器核一起定位的宽I/O DRAM。低功率双数据速率3动态随机存取存储器(LPDDR3 DRAM)存储器外部地连接到SoC或是SoC的嵌入部分。在各实施例中,计算设备至少可以被包括在蜂窝电话、移动设备、嵌入式系统、视频游戏、媒体控制台、膝上型计算机、台式计算机、服务器和/或数据中心中。
-
公开(公告)号:CN116235187A
公开(公告)日:2023-06-06
申请号:CN202180052316.3
申请日:2021-05-18
Applicant: 微软技术许可有限责任公司
IPC: G06N3/082 , G06N3/0499
Abstract: 本公开的实施例包括用于压缩和解压缩由神经网络中的子块生成的数据的系统和方法。在一些实施例中,在神经网络中的压缩块处接收输入矩阵。压缩块将输入矩阵压缩为经压缩的矩阵并且输出经压缩的矩阵。相对于输入矩阵的维数经压缩的矩阵具有减少的维数。解压缩块取回经压缩的矩阵。解压缩块将经压缩的矩阵解压缩为经解压缩的矩阵并且输出经解压缩的矩阵。经解压缩的矩阵具有与输入矩阵的维数相同的维数。压缩块和解压缩块基于从神经网络接收的反馈被优化。
-
-
公开(公告)号:CN104737093B
公开(公告)日:2019-01-08
申请号:CN201380054344.4
申请日:2013-10-18
Applicant: 微软技术许可有限责任公司
IPC: G06F1/3287 , H04N19/156
Abstract: 一种传感器和处理系统基于能量管理考量在各个远程传感器节点与处理子系统之间动态地划分或分配功能。冗余功能被置于处理子系统和各个远程传感器节点中的每一者处,并且每一传感器节点与处理子系统协调以确定执行特定功能的位置(例如,在处理子系统处还是在传感器节点处)。
-
公开(公告)号:CN105144106A
公开(公告)日:2015-12-09
申请号:CN201480006767.3
申请日:2014-01-29
Applicant: 微软技术许可有限责任公司
IPC: G06F9/50
Abstract: 一种用于操作计算设备的方法包括基于工作负载或来自不同类型的应用的请求来动态管理至少两种类型的存储器。第一类型的存储器可以是高性能存储器,它相比于计算设备中的第二类型的存储器而言可具有更高带宽、更低存储器等待时间和/或更低的功耗。在一个实施例中,计算设备包括片上系统(SoC),其包括与一个或多个处理器核一起定位的宽I/O DRAM。低功率双数据速率3动态随机存取存储器(LPDDR3 DRAM)存储器外部地连接到SoC或是SoC的嵌入部分。在各实施例中,计算设备至少可以被包括在蜂窝电话、移动设备、嵌入式系统、视频游戏、媒体控制台、膝上型计算机、台式计算机、服务器和/或数据中心中。
-
公开(公告)号:CN116157802A
公开(公告)日:2023-05-23
申请号:CN202180059885.0
申请日:2021-05-27
Applicant: 微软技术许可有限责任公司
IPC: G06N3/0455 , G06N3/08
Abstract: 本公开的实施例包括用于基于训练数据的位置来压缩标记的系统和方法,该训练数据被用于训练转换器模型。在一些实施例中,用于训练转换器模型的输入数据集合被接收。该输入数据集合包括标记集合和位置值集合。标记集合中的第一标记被标识,第一标记与标记集合中的第二标记相同。表示第一标记的位置值与表示第二标记的位置值被组合。通过从标记集合中移除第一标记来修改该标记集合。训练数据被生成,以包括经修改的标记集合和位置值集合。使用训练数据集合来训练转换器模型。
-
-
-
-
-
-
-
-
-