-
公开(公告)号:CN108694080B
公开(公告)日:2024-09-03
申请号:CN201810310904.2
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 本发明涉及高效线程组调度。描述了用于促进自主机器处的智能线程调度的机构。如本文所描述,实施例的方法包括:检测关于与多个工作负荷相对应的多个线程的依赖性信息,所述多个工作负荷关联于与包括图形处理器的处理器相关的任务。所述方法可以进一步包括:基于所述依赖性信息来生成线程组的树,其中每一个线程组包括多个线程;以及调度与类似依赖性相关联的线程组中的一个或多个,以避免依赖性冲突。
-
公开(公告)号:CN113191501A
公开(公告)日:2021-07-30
申请号:CN202110382312.3
申请日:2018-04-09
Applicant: 英特尔公司
Abstract: 一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN108805792A
公开(公告)日:2018-11-13
申请号:CN201810393515.0
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: E.努尔维塔迪 , B.温布 , N.C.G.冯博里斯 , R.巴里克 , T-H.林 , K.辛哈 , N.R.萨蒂什 , J.博特莱森 , F.阿克巴里 , A.科克 , N.斯里尼瓦萨 , D.金 , S.S.巴格索尔基 , J.E.戈奇利希 , F.陈 , E.奥尔德-艾哈迈德-瓦尔 , K.尼利斯 , X.陈 , 姚安邦
IPC: G06T1/20
CPC classification number: G06T1/20 , G06F9/3001 , G06F9/3017 , G06F9/3851 , G06F9/3887 , G06F9/3895 , G06N3/04 , G06N3/0445 , G06N3/0454 , G06N3/063 , G06N3/08 , G06N3/084
Abstract: 提供了具有先进调度的可编程粗粒度化和稀疏矩阵计算硬件。一个实施例提供执行机器学习操作的计算装置,所述计算装置包括解码单元以将单个指令解码成经解码的指令,所述经解码的指令要使得所述计算装置执行复杂机器学习计算操作。
-
公开(公告)号:CN108694692B
公开(公告)日:2024-11-19
申请号:CN201810310968.2
申请日:2018-04-09
Applicant: 英特尔公司
IPC: G06T1/20 , G06N3/0495 , G06N3/063 , G06F17/16
Abstract: 一种用于促进处理稀疏矩阵的设备被公开。所述设备包含多个处理单元,其各自包括一个或多个处理元件,所述一个或多个处理元件包含用于读取操作数的逻辑、用于将两个或更多操作数相乘的乘法单元、以及用于标识具有零值的操作数并在所述乘法单元阻止调度具有所述零值的所述操作数的调度器。
-
公开(公告)号:CN113672197A
公开(公告)日:2021-11-19
申请号:CN202110906984.X
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: H.考尔 , M.A.安德斯 , S.K.马修 , 姚安邦 , J.雷 , P.T.唐 , M.S.斯特里克兰德 , X.陈 , T.斯派斯曼 , A.R.阿普 , A.科克 , K.辛哈 , B.温布 , N.C.G.冯博里斯 , E.努尔维塔迪 , R.巴里克 , T-H.林 , V.兰加纳坦 , S.雅哈吉达尔
IPC: G06F7/57
Abstract: 一个实施例提供了包括具有在整数数据路径和浮点数据路径之间共享的加法器和乘法器的计算单元的机器学习硬件加速器,到乘法器的输入操作数的高位要在浮点操作期间被门控。
-
公开(公告)号:CN108694080A
公开(公告)日:2018-10-23
申请号:CN201810310904.2
申请日:2018-04-09
Applicant: 英特尔公司
CPC classification number: G06F9/4881 , G06F2209/483 , G06F2209/484 , G06T1/20 , G06F9/3851 , G06F9/3887 , G06F9/5066
Abstract: 本发明涉及高效线程组调度。描述了用于促进自主机器处的智能线程调度的机构。如本文所描述,实施例的方法包括:检测关于与多个工作负荷相对应的多个线程的依赖性信息,所述多个工作负荷关联于与包括图形处理器的处理器相关的任务。所述方法可以进一步包括:基于所述依赖性信息来生成线程组的树,其中每一个线程组包括多个线程;以及调度与类似依赖性相关联的线程组中的一个或多个,以避免依赖性冲突。
-
公开(公告)号:CN108694081B
公开(公告)日:2024-11-08
申请号:CN201810310957.4
申请日:2018-04-09
Applicant: 英特尔公司
Inventor: S.雅哈吉达尔 , A.科克 , V.兰加纳坦 , B.温布 , J.雷 , L.马 , A.阿普 , J.博特尔森 , N.R.萨蒂什 , F.阿克巴里 , K.辛哈 , E.努尔维塔迪
Abstract: 描述了一种用于促进快速数据操作的机制,所述快速数据操作用于在自主机器的机器学习。如本文描述的,一种实施例的方法包含检测在计算任务中要由包含图形处理器的处理器的计算流水线的计算部件使用的输入数据。所述方法可进一步包含确定来自所述数据的一个或多个频繁使用的数据值(FDV),以及推送所述一个或多个频繁数据值以旁路所述计算任务。
-
公开(公告)号:CN112947894B
公开(公告)日:2024-07-26
申请号:CN202110256528.5
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: H.考尔 , M.A.安德斯 , S.K.马修 , 姚安邦 , J.雷 , P.T.唐 , M.S.斯特里克兰德 , X.陈 , T.斯派斯曼 , A.R.阿普 , A.科克 , K.辛哈 , B.温布 , N.C.G.冯博里斯 , E.努尔维塔迪 , R.巴里克 , T-H.林 , V.兰加纳坦 , S.雅哈吉达尔
IPC: G06F7/57
Abstract: 一个实施例提供了包括具有在整数数据路径和浮点数据路径之间共享的加法器和乘法器的计算单元的机器学习硬件加速器,到乘法器的输入操作数的高位要在浮点操作期间被门控。
-
公开(公告)号:CN115826916A
公开(公告)日:2023-03-21
申请号:CN202211446828.0
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: H.考尔 , M.A.安德斯 , S.K.马修 , 姚安邦 , J.雷 , P.T.唐 , M.S.斯特里克兰德 , X.陈 , T.斯派斯曼 , A.R.阿普 , A.科克 , K.辛哈 , B.温布 , N.C.G.冯博里斯 , E.努尔维塔迪 , R.巴里克 , T-H.林 , V.兰加纳坦 , S.雅哈吉达尔
IPC: G06F7/57
Abstract: 一个实施例提供了包括具有在整数数据路径和浮点数据路径之间共享的加法器和乘法器的计算单元的机器学习硬件加速器,到乘法器的输入操作数的高位要在浮点操作期间被门控。
-
公开(公告)号:CN111666066B
公开(公告)日:2021-11-09
申请号:CN202010498935.2
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: H.考尔 , M.A.安德斯 , S.K.马修 , 姚安邦 , J.雷 , P.T.唐 , M.S.斯特里克兰德 , X.陈 , T.斯派斯曼 , A.R.阿普 , A.科克 , K.辛哈 , B.温布 , N.C.G.冯博里斯 , E.努尔维塔迪 , R.巴里克 , T-H.林 , V.兰加纳坦 , S.雅哈吉达尔
IPC: G06F7/57
Abstract: 一个实施例提供了包括具有在整数数据路径和浮点数据路径之间共享的加法器和乘法器的计算单元的机器学习硬件加速器,到乘法器的输入操作数的高位要在浮点操作期间被门控。
-
-
-
-
-
-
-
-
-