-
公开(公告)号:CN109993684A
公开(公告)日:2019-07-09
申请号:CN201811574695.9
申请日:2018-12-21
Applicant: 英特尔公司
Inventor: J·雷 , B·阿什博 , P·萨蒂 , P·拉马尼 , R·哈利哈拉 , J·C·贾斯汀 , J·黄 , X·崔 , T·B·克斯塔 , T·龚 , E·乌尔德-阿迈德-瓦尔 , K·巴拉苏布拉马尼恩 , A·托马斯 , O·H·埃尔波尔 , J·鲍巴 , G·庄 , B·舒伯拉玛尼安 , G·凯斯金 , C·萨科斯维尔 , R·普尔纳查得兰
Abstract: 各实施例大体上涉及机器学习和深度学习处理中的压缩。用于压缩无类型数据的设备的实施例包括图形处理单元(GPU),图形处理单元(GPU)包括数据压缩流水线,该数据压缩流水线包括:数据端口,该数据端口与一个或多个着色器核耦合,其中该数据端口用于允许无类型数据的传递而无需格式转换;以及3D压缩/解压缩单元,用于提供对要存储到存储器子系统的无类型数据的压缩,以及对来自存储器子系统的无类型数据的解压缩。
-
公开(公告)号:CN113454596A
公开(公告)日:2021-09-28
申请号:CN202080014238.3
申请日:2020-02-11
Applicant: 英特尔公司
Inventor: J·雷 , A·阿南塔拉曼 , A·R·阿普 , A·科克 , E·乌尔-艾哈迈德-瓦尔 , V·安德列 , S·麦于兰 , N·加洛普冯博里斯 , M·麦克费尔森 , B·阿什博 , M·拉曼多斯 , V·维穆拉帕利 , W·萨德勒 , J·皮尔斯 , S·金 , V·乔治
Abstract: 涉及图形处理器中的标量核集成的方法和设备。在示例中,一种设备包括处理器,所述处理器用于:从主机集合体接收用于图形工作负荷的工作负荷指令集,确定操作集合中适合于由所述图形处理装置的标量处理器集合体执行的第一操作子集和操作集合中适合于由所述图形处理装置的向量处理器集合体执行的第二操作子集,将所述第一操作子集指派给所述标量处理器集合体以用于执行以生成第一输出集合,将所述第二操作子集指派给所述向量处理器集合体以用于执行以生成第二输出集合。还公开并要求保护其它实施例。
-
公开(公告)号:CN113412475A
公开(公告)日:2021-09-17
申请号:CN202080011890.X
申请日:2020-02-11
Applicant: 英特尔公司
Abstract: 关于事务页错误处置的方法和装置。在示例中,一种装置包括处理器,该处理器用于:将图形工作负载的执行线程划分为要被原子地执行的事务的集合;发起线程的执行;以及根据以下之一管理线程的执行:响应于确定了页错误在事务的执行中发生,根据第一协议管理线程的执行;或者响应于确定了页错误未在事务的执行中发生,根据第二协议管理线程的执行。还公开并要求保护其他实施例。
-
公开(公告)号:CN113366447A
公开(公告)日:2021-09-07
申请号:CN202080011554.5
申请日:2020-03-14
Applicant: 英特尔公司
Inventor: V·兰加纳坦 , A·R·阿普 , B·阿什博 , P·道尔 , B·福里福莱特 , A·亨特 , B·英斯科 , S·贾纳斯 , A·考克 , A·纳瓦勒 , J·雷 , K·辛哈 , L·斯特里拉马萨尔玛 , P·萨蒂 , J·瓦莱里奥
IPC: G06F9/50
Abstract: 实施例总体上涉及图形处理中的计算优化。装置的实施例包括:一个或多个处理器,包括用于处理数据的多片图形处理单元(GPU),多片GPU包括多个处理器片;以及存储器,用于存储数据以供处理,其中,装置用于:接收计算工作以供GPU处理,将计算工作分区为多个工作单元,将多个工作单元中的每一个工作单元指派给处理器片中的一个处理器片,以及使用被指派给工作单元的处理器片来处理计算工作。
-
公开(公告)号:CN113094298A
公开(公告)日:2021-07-09
申请号:CN202011010193.0
申请日:2020-09-23
Applicant: 英特尔公司
IPC: G06F12/084 , G06F12/0897 , G06F12/1027 , G06T1/20
Abstract: 公开了一种用于促进对本地存储器的分区的装置。该装置包括:多个执行单元,用于执行多个执行线程;存储器,其被耦合以在多个执行单元之间共享访问;以及分区硬件,用于对要用作高速缓存和共享本地存储器(SLM)的存储器进行分区;其中,分区硬件基于在活动的执行单元上执行的多个执行线程的数量来对存储器进行分区。
-
公开(公告)号:CN111427680A
公开(公告)日:2020-07-17
申请号:CN201911250693.9
申请日:2019-12-09
Applicant: 英特尔公司
Inventor: B·温布 , B·弗里弗莱特 , J·瓦乐瑞奥 , M·阿波达卡 , B·阿什博 , H·纳鲁利 , A·沙阿 , M·拉玛多斯 , D·普费尔 , A·科克 , A·纳瓦勒 , A·R·阿普 , J·雷 , T·施鲁斯勒
Abstract: 本文所描述的实施例提供了一种图形、媒体和计算设备,其具有由较小的图形设备的多个分片组成的分片式架构。针对这种设备的工作分发基础设施实现工作负载跨设备的多个分片的分发。可以将工作项目提交到多个分片中的任何一个或多个,其中工作负载能够跨越多个分片。另外地,在完成工作项目之后,设备内的图形、媒体和/或计算引擎可以容易地获取新的工作项目从而以最小的时延执行。
-
-
-
-
-