-
公开(公告)号:CN108734274A
公开(公告)日:2018-11-02
申请号:CN201810368545.6
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN108701053A
公开(公告)日:2018-10-23
申请号:CN201780013420.5
申请日:2017-01-10
Applicant: 英特尔公司
CPC classification number: G06F9/48 , G06F9/38 , G06F9/3851 , G06F9/46 , G06F9/461 , G06F9/4806 , G06F9/4812 , G06F9/4843 , G06F9/4881 , G06F13/24 , G06F13/32 , G06T1/20 , G06T2200/28
Abstract: 描述了用于促进针对计算环境中的任务执行的执行感知混合抢占的机制。如本文中所述,各实施例的方法包括检测由计算设备主控的软件应用,其中,所述软件应用用于促进能够由所述计算设备的图形处理器执行的一个或多个任务。所述方法可进一步包括基于分别与处于线程级执行和工作组级执行的所述一个或多个任务相关的第一时间估计和第二时间估计的比较来选择细粒度抢占或粗粒度抢占中的至少一个。所述方法可进一步包括启动所述细粒度抢占和所述粗粒度抢占中所选择的抢占的执行。
-
公开(公告)号:CN118394414A
公开(公告)日:2024-07-26
申请号:CN202410567634.9
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , B·拉克舍玛南 , T·史佩斯曼 , J·雷 , P·T·唐 , M·斯特里克兰德 , 陈晓明 , 姚安邦 , B·J·阿什博 , L·L·赫德 , 马立伟
IPC: G06F9/38 , G06F9/30 , G06F9/302 , G06F13/40 , G06F13/42 , G06F16/242 , G06T1/20 , G06N20/10 , G06N3/044 , G06N3/045 , G06N3/063 , G06N3/084
Abstract: 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。
-
公开(公告)号:CN110543332B
公开(公告)日:2024-01-19
申请号:CN201910973729.X
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , B·拉克舍玛南 , T·史佩斯曼 , J·雷 , P·T·唐 , M·斯特里克兰德 , 陈晓明 , 姚安邦 , B·J·阿什博 , L·L·赫德 , 马立伟
Abstract: 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。(56)对比文件胡玉贵.一种基于OPENACC指令加速的均值模糊算法《.软件导刊》.2013,(第01期),Stephen Junkins.The ComputeArchitecture of IntelR ProcessorGraphics Gen9《.Intel官网:"https://www.intel.com/content/dam/develop/external/us/en/documents/the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf》.2015,NVIDIA.NVIDIA"s Next Generation CUDACompute Architecture : Fermi《.道客巴巴网站》.2015,
-
-
公开(公告)号:CN111539518B
公开(公告)日:2023-05-23
申请号:CN202010356162.4
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
IPC: G06N3/0464 , G06N3/084 , G06T1/40
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN109712064B
公开(公告)日:2023-05-02
申请号:CN201910002150.9
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , B·拉克舍玛南 , T·史佩斯曼 , J·雷 , P·T·唐 , M·斯特里克兰德 , 陈晓明 , 姚安邦 , B·J·阿什博 , L·L·赫德 , 马立伟
Abstract: 一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。
-
公开(公告)号:CN115525399A
公开(公告)日:2022-12-27
申请号:CN202210411900.X
申请日:2022-04-19
Applicant: 英特尔公司
Abstract: 公开一种用于促进用于图形环境中的抢占的屏障状态保存和恢复的装置。该装置包括:处理资源,用于执行被包括在线程组(TG)中的多个执行线程的处理资源;以及中间线程抢占屏障保存和恢复硬件电路,用于:响应于中间线程抢占事件而发起异常处置例程,该异常处理例程用于使屏障信令事件被发布;响应于屏障信令事件,接收线程组(TG)的线程的有效指定线程状态的指示;以及响应于接收到TG的线程的有效指定线程状态的指示,由TG的、具有有效指定线程状态的线程使得针对TG的命名屏障发起屏障保存例程和屏障恢复例程。
-
公开(公告)号:CN113705789A
公开(公告)日:2021-11-26
申请号:CN202111003293.5
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN110543332A
公开(公告)日:2019-12-06
申请号:CN201910973729.X
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: E·乌尔德-阿迈德-瓦尔 , B·拉克舍玛南 , T·史佩斯曼 , J·雷 , P·T·唐 , M·斯特里克兰德 , 陈晓明 , 姚安邦 , B·J·阿什博 , L·L·赫德 , 马立伟
Abstract: 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。
-
-
-
-
-
-
-
-
-