-
公开(公告)号:CN108694692A
公开(公告)日:2018-10-23
申请号:CN201810310968.2
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN108694080B
公开(公告)日:2024-09-03
申请号:CN201810310904.2
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 本发明涉及高效线程组调度。描述了用于促进自主机器处的智能线程调度的机构。如本文所描述,实施例的方法包括:检测关于与多个工作负荷相对应的多个线程的依赖性信息,所述多个工作负荷关联于与包括图形处理器的处理器相关的任务。所述方法可以进一步包括:基于所述依赖性信息来生成线程组的树,其中每一个线程组包括多个线程;以及调度与类似依赖性相关联的线程组中的一个或多个,以避免依赖性冲突。
-
公开(公告)号:CN113191501A
公开(公告)日:2021-07-30
申请号:CN202110382312.3
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN108694692B
公开(公告)日:2024-11-19
申请号:CN201810310968.2
申请日:2018-04-09
Applicant: 英特尔公司
IPC: G06T1/20 , G06N3/0495 , G06N3/063 , G06F17/16
Abstract: 一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN108694080A
公开(公告)日:2018-10-23
申请号:CN201810310904.2
申请日:2018-04-09
Applicant: 英特尔公司
CPC classification number: G06F9/4881 , G06F2209/483 , G06F2209/484 , G06T1/20 , G06F9/3851 , G06F9/3887 , G06F9/5066
Abstract: 本发明涉及高效线程组调度。描述了用于促进自主机器处的智能线程调度的机构。如本文所描述,实施例的方法包括:检测关于与多个工作负荷相对应的多个线程的依赖性信息,所述多个工作负荷关联于与包括图形处理器的处理器相关的任务。所述方法可以进一步包括:基于所述依赖性信息来生成线程组的树,其中每一个线程组包括多个线程;以及调度与类似依赖性相关联的线程组中的一个或多个,以避免依赖性冲突。
-
公开(公告)号:CN112116098B
公开(公告)日:2024-06-14
申请号:CN202010842577.2
申请日:2018-04-09
Applicant: 英特尔公司
IPC: G06N3/0495 , G06N3/0499 , G06N3/088 , G06N3/0895 , G06N3/09 , G06N3/098
Abstract: 机器学习稀疏计算机制。一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN112116098A
公开(公告)日:2020-12-22
申请号:CN202010842577.2
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 机器学习稀疏计算机制。一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN108734650A
公开(公告)日:2018-11-02
申请号:CN201810372891.1
申请日:2018-04-24
Applicant: 英特尔公司
Inventor: S.雅哈吉达尔 , A.科克 , T.斯派斯曼 , V.兰加纳坦 , M.麦克弗森 , B.温布 , J.雷 , R.巴里克 , 姚安邦 , L.赫德 , J.维斯特 , A.阿普 , D.金 , F.陈 , N.R.萨蒂什 , N.G.冯博里斯 , P.唐 , T-H.林 , X.陈 , F.阿克巴里 , K.辛哈 , E.努尔维塔迪 , N.斯利尼瓦萨 , M.斯特里克兰
CPC classification number: G06N3/063 , G06F1/3287 , G06F1/3293 , G06F9/30014 , G06F9/30036 , G06F15/76 , G06F15/78 , G06N3/04 , G06N3/0445 , G06N3/0454 , G06N3/08 , G06N3/084 , G06T1/20 , G06T1/60 , G06T15/005
Abstract: 在示例中,一种设备包括:计算引擎,包含高精度部件和低精度部件;以及至少部分包括硬件逻辑的逻辑,用于在所述计算引擎中接收指令、选择所述高精度部件或者所述低精度部件中的至少一个来执行所述指令、以及将门控应用于所述高精度部件或者所述低精度部件中的至少一个以执行所述指令。还公开并且要求保护其他实施例。
-
-
-
-
-
-
-