-
公开(公告)号:CN119377541A
公开(公告)日:2025-01-28
申请号:CN202411416040.4
申请日:2019-03-25
Applicant: 英特尔公司
IPC: G06F17/16
Abstract: 所公开的实施例涉及用于稀疏‑密集矩阵指令的加速器。在一个示例中,一种用于执行稀疏‑密集矩阵乘法指令的处理器,包括:取出电路,用于取出稀疏‑密集矩阵乘法指令,稀疏‑密集矩阵乘法指令具有用于指定操作码、密集输出矩阵、密集源矩阵、和具有非零元素的稀疏度的稀疏源矩阵的字段,稀疏度小于一;解码电路,用于对所取出的稀疏‑密集矩阵乘法指令解码;执行电路,用于执行经解码的稀疏‑密集矩阵乘法指令以对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成该非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。
-
公开(公告)号:CN111932434B
公开(公告)日:2024-08-02
申请号:CN202010801699.7
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·R·阿普 , A·考克 , L·L·赫德 , D·金 , M·B·麦克弗森 , J·C·韦斯特 , 陈峰 , F·阿赫巴里 , N·斯里尼瓦萨 , N·R·萨蒂什 , J·雷 , P·T·唐 , M·S·斯特里克兰 , 陈晓明 , 姚安邦 , T·史佩斯曼
Abstract: 公开了一种用于促进计算优化的装置。该装置包括分类逻辑,该分类逻辑用于基于浮点线程操作的位深度将处理线程分类到数个线程组中。
-
公开(公告)号:CN111539518B
公开(公告)日:2023-05-23
申请号:CN202010356162.4
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
IPC: G06N3/0464 , G06N3/084 , G06T1/40
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN113705789A
公开(公告)日:2021-11-26
申请号:CN202111003293.5
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。
-
公开(公告)号:CN104204991B
公开(公告)日:2018-01-02
申请号:CN201280072145.1
申请日:2012-03-30
Applicant: 英特尔公司
CPC classification number: G06F7/36 , G06F7/32 , G06F9/30014 , G06F9/30021 , G06F9/30032 , G06F9/30036 , G06F9/3005 , G06F9/3012 , G06F9/3867
Abstract: 描述了一种半导体芯片,其包括具有功能单元的指令执行单元,功能单元具有最小和最大比较电路以及随后的交织电路,最小和最大比较电路分别用于标识来自两个不同的已排序元素集合的相同位置元素的最小值和最大值,交织电路用于交织所述最小值和最大值以帮助形成第三已排序集合,该第三已排序集合由来自所述不同集合的元素组成并大于所述不同集合中的每个集合。
-
公开(公告)号:CN108292220B
公开(公告)日:2024-05-28
申请号:CN201680070403.0
申请日:2016-11-18
Applicant: 英特尔公司
Abstract: 描述了用于加速图形分析的装置和方法。例如,处理器的一个实施例包括:指令取出单元,用于取出包括集合交和集合并操作的程序代码;图形加速器单元(GAU),用于执行该程序代码的、与集合交和集合并操作有关的至少第一部分,并生成结果;以及执行单元,用于使用从GAU提供的结果来执行该程序代码的至少第二部分。
-
公开(公告)号:CN113705789B
公开(公告)日:2024-01-16
申请号:CN202111003293.5
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: P·萨蒂 , N·斯里尼瓦萨 , 陈峰 , J·雷 , B·J·阿什博 , N·C·加洛泊凡博列斯 , E·努维塔蒂 , B·文布 , T-H·林 , K·辛哈 , R·巴瑞克 , S·S·巴格索克希 , J·E·高茨施里奇 , A·考克 , N·R·萨蒂什 , F·阿赫巴里 , D·金 , W·付 , T·T·施吕斯列尔 , J·B·马斯特罗纳尔德 , L·L·赫德 , J·H·费特 , J·S·波尔斯 , A·T·莱克 , K·瓦德亚纳桑 , D·伯克 , S·马余兰 , A·R·阿普
IPC: G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06N3/088 , G06N3/09 , G06T1/20
Abstract: 公开了一种用于促进计算优化的装置。该装置包括多个处理单元,该多个处理单元各自包括多个执行单元(EU),其中,该多个EU包括第一EU类型和第二EU类型。(56)对比文件刘金硕;刘天晓;吴慧;曾秋梅;任梦菲;顾宜淳.从图形处理器到基于GPU的通用计算.武汉大学学报(理学版).2013,(02),全文.
-
公开(公告)号:CN110866861B
公开(公告)日:2023-08-01
申请号:CN201911107740.4
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·R·阿普 , A·考克 , L·L·赫德 , D·金 , M·B·麦克弗森 , J·C·韦斯特 , 陈峰 , F·阿赫巴里 , N·斯里尼瓦萨 , N·R·萨蒂什 , J·雷 , P·T·唐 , M·S·斯特里克兰 , 陈晓明 , 姚安邦 , T·史佩斯曼
Abstract: 公开了一种用于促进计算优化的装置。该装置包括分类逻辑,该分类逻辑用于基于浮点线程操作的位深度将处理线程分类到数个线程组中。
-
公开(公告)号:CN110321525A
公开(公告)日:2019-10-11
申请号:CN201910227563.7
申请日:2019-03-25
Applicant: 英特尔公司
IPC: G06F17/16
Abstract: 所公开的实施例涉及用于稀疏-密集矩阵指令的加速器。在一个示例中,一种用于执行稀疏-密集矩阵乘法指令的处理器,包括:取出电路,用于取出稀疏-密集矩阵乘法指令,稀疏-密集矩阵乘法指令具有用于指定操作码、密集输出矩阵、密集源矩阵、和具有非零元素的稀疏度的稀疏源矩阵的字段,稀疏度小于一;解码电路,用于对所取出的稀疏-密集矩阵乘法指令解码;执行电路,用于执行经解码的稀疏-密集矩阵乘法指令以对于所指定的稀疏源矩阵的行M和列K处的每个非零元素进行以下操作:生成该非零元素与所指定的密集源矩阵的行K和列N处的每个对应密集元素的乘积;以及生成每个所生成的乘积与所指定的密集输出矩阵的行M和列N处的对应输出元素的先前值的累加和。
-
公开(公告)号:CN110163792A
公开(公告)日:2019-08-23
申请号:CN201910429161.5
申请日:2018-04-23
Applicant: 英特尔公司
Inventor: A·R·阿普 , A·考克 , L·L·赫德 , D·金 , M·B·麦克弗森 , J·C·韦斯特 , 陈峰 , F·阿赫巴里 , N·斯里尼瓦萨 , N·R·萨蒂什 , J·雷 , P·T·唐 , M·S·斯特里克兰 , 陈晓明 , 姚安邦 , T·史佩斯曼
Abstract: 公开了一种用于促进计算优化的装置。该装置包括分类逻辑,该分类逻辑用于基于浮点线程操作的位深度将处理线程分类到数个线程组中。
-
-
-
-
-
-
-
-
-