-
公开(公告)号:CN116414455A
公开(公告)日:2023-07-11
申请号:CN202211546793.8
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
IPC: G06F9/30 , G06F9/38 , G06F9/50 , G06N3/0464 , G06N3/0442 , G06N3/048 , G06N3/0499 , G06N3/088 , G06N3/084 , G06N3/063 , G06N3/09 , G06T1/20
Abstract: 本申请发明名称为“低精度机器学习操作的计算优化”。一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN108805792B
公开(公告)日:2025-01-28
申请号:CN201810393515.0
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: E.努尔维塔迪 , B.温布 , N.C.G.冯博里斯 , R.巴里克 , T-H.林 , K.辛哈 , N.R.萨蒂什 , J.博特莱森 , F.阿克巴里 , A.科克 , N.斯里尼瓦萨 , D.金 , S.S.巴格索尔基 , J.E.戈奇利希 , F.陈 , E.奥尔德-艾哈迈德-瓦尔 , K.尼利斯 , X.陈 , 姚安邦
IPC: G06T1/20
Abstract: 提供了具有先进调度的可编程粗粒度化和稀疏矩阵计算硬件。一个实施例提供执行机器学习操作的计算装置,所述计算装置包括解码单元以将单个指令解码成经解码的指令,所述经解码的指令要使得所述计算装置执行复杂机器学习计算操作。
-
公开(公告)号:CN110737470B
公开(公告)日:2023-06-16
申请号:CN201910813309.5
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
IPC: G06F9/30 , G06F9/38 , G06F9/50 , G06N3/0464 , G06N3/0442 , G06N3/0499 , G06N3/063 , G06N3/09 , G06T1/20
Abstract: 一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN110349075A
公开(公告)日:2019-10-18
申请号:CN201910429570.5
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
Abstract: 低精度机器学习操作的计算优化,一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN108734649A
公开(公告)日:2018-11-02
申请号:CN201810371854.9
申请日:2018-04-24
Applicant: 英特尔公司
Inventor: P.瑟蒂 , N.比斯沃尔 , R.巴里克 , S.巴格索尔基 , J.戈特奇利希 , J.维斯特 , A.阿普 , B.达斯 , C.萨克蒂韦尔 , E.奥尔德-艾哈迈德-瓦尔 , G.奇林吉尔 , N.沙 , S.巴兰 , X.陈 , A.沙尔马 , M.瓦雷尔卡 , K.尼利斯
CPC classification number: G06N3/0454 , G06F9/3001 , G06F9/3017 , G06F9/3851 , G06F9/3887 , G06F9/3895 , G06N3/0445 , G06N3/063 , G06N3/084 , G06T1/20 , G06T15/005
Abstract: 一种用于促进神经网络(NN)训练的装置被公开。所述装置包括训练逻辑,所述训练逻辑用于接收一个或多个网络约束,并通过基于所述网络约束自动地确定最佳网络布局和参数来训练所述NN。
-
公开(公告)号:CN115082283A
公开(公告)日:2022-09-20
申请号:CN202210661460.3
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
Abstract: 一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN108805792A
公开(公告)日:2018-11-13
申请号:CN201810393515.0
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: E.努尔维塔迪 , B.温布 , N.C.G.冯博里斯 , R.巴里克 , T-H.林 , K.辛哈 , N.R.萨蒂什 , J.博特莱森 , F.阿克巴里 , A.科克 , N.斯里尼瓦萨 , D.金 , S.S.巴格索尔基 , J.E.戈奇利希 , F.陈 , E.奥尔德-艾哈迈德-瓦尔 , K.尼利斯 , X.陈 , 姚安邦
IPC: G06T1/20
CPC classification number: G06T1/20 , G06F9/3001 , G06F9/3017 , G06F9/3851 , G06F9/3887 , G06F9/3895 , G06N3/04 , G06N3/0445 , G06N3/0454 , G06N3/063 , G06N3/08 , G06N3/084
Abstract: 提供了具有先进调度的可编程粗粒度化和稀疏矩阵计算硬件。一个实施例提供执行机器学习操作的计算装置,所述计算装置包括解码单元以将单个指令解码成经解码的指令,所述经解码的指令要使得所述计算装置执行复杂机器学习计算操作。
-
公开(公告)号:CN108734272A
公开(公告)日:2018-11-02
申请号:CN201810337318.7
申请日:2018-04-16
Applicant: 英特尔公司
Inventor: 马立伟 , E.奥尔德-艾哈迈德-瓦尔 , B.拉克什马南 , B.J.阿什鲍格 , J.金 , J.博特莱森 , M.B.麦克弗森 , K.尼利斯 , D.斯利瓦斯塔瓦 , J.雷 , P.T.唐 , M.S.斯特里克兰 , X.陈 , 姚安邦 , T.斯派斯曼 , A.科克 , A.R.阿普
CPC classification number: G06N3/04 , G06N3/0445 , G06N3/0454 , G06N3/063 , G06N3/082 , G06T1/20 , G06F9/3851 , G06F9/3887 , G06N3/084
Abstract: 本发明涉及卷积神经网络优化机构。公开了一种促进卷积神经网络(CNN)的优化的装置。所述装置包括优化逻辑,所述优化逻辑要接收具有指令列表的CNN模型,并且所述优化逻辑包括通过消除所述指令列表中包括权重值0的分支对所述指令列表进行优化的修剪逻辑。
-
公开(公告)号:CN108805791B
公开(公告)日:2024-11-12
申请号:CN201810392234.3
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
IPC: G06T1/20 , G06T1/60 , G06F7/57 , G06F15/167 , G06F15/17 , G06F9/38 , G06N3/044 , G06N3/0464 , G06N3/08
Abstract: 一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
公开(公告)号:CN110349075B
公开(公告)日:2020-10-20
申请号:CN201910429570.5
申请日:2018-04-27
Applicant: 英特尔公司
Inventor: A.科克 , M.麦克弗森 , J.雷 , 姚安邦 , L.马 , L.赫德 , S.巴格索尔基 , J.维斯特 , A.阿普 , B.阿什鲍格 , D.金 , E.奥尔德-艾哈迈德-瓦尔 , P.唐 , X.陈 , B.拉克什马南 , K.尼利斯 , M.斯特里克兰
Abstract: 低精度机器学习操作的计算优化,一个实施例提供了一种包括动态精度浮点单元的通用图形处理单元,所述动态精度浮点单元包括控制单元,所述控制单元具有精度跟踪硬件逻辑以跟踪与目标精度相关的计算数据的精度位的可用数量,其中动态精度浮点单元包括计算逻辑来以多个精度输出数据。
-
-
-
-
-
-
-
-
-