-
公开(公告)号:CN108734636A
公开(公告)日:2018-11-02
申请号:CN201810360463.7
申请日:2018-04-20
Applicant: 英特尔公司
Inventor: R·巴瑞克 , E·乌尔德-阿迈德-瓦尔 , 陈晓明 , D·斯里瓦斯塔瓦 , 姚安邦 , K·尼利斯 , E·努维塔蒂 , S·S·巴格索克希 , B·韦布 , T·史佩斯曼 , P·T·唐
IPC: G06T1/20
CPC classification number: G06N3/063 , G06F9/3001 , G06F9/3017 , G06F9/3851 , G06F9/3887 , G06F9/3895 , G06N3/0445 , G06N3/0454 , G06N3/084 , G06T1/20
Abstract: 一个实施例提供一种用于执行机器学习操作的计算设备,所述设备包括用于将单指令解码为已解码指令的解码单元,所述已解码指令用于执行一个或多个机器学习操作,其中,所述解码单元用于基于所述一个或多个机器学习操作的参数来请求调度器将所述一个或多个机器学习操作调度给可编程计算单元阵列和固定功能计算单元中的一个。
-
公开(公告)号:CN108268424A
公开(公告)日:2018-07-10
申请号:CN201810001937.9
申请日:2018-01-02
Applicant: 英特尔公司
CPC classification number: G06F17/16 , G06F9/3001 , G06F9/30036 , H03M7/30 , G06F9/5044
Abstract: 描述了用于处理具有偏斜非零分布的稀疏矩阵数据的异构硬件加速器架构。加速器包括用于通过高带宽接口从第一存储器访问数据的稀疏片以及用于通过低等待时间接口从第二存储器随机地访问数据的超/极稀疏片。该加速器确定要执行涉及矩阵的一个或多个计算任务,将矩阵分区为第一多个块和第二多个块,该第一多个块包括该矩阵的一个或多个稀疏区段,该第二多个块包括该矩阵中为超稀疏或极稀疏的区段。该加速器使(多个)稀疏片使用第一多个块来执行针对(多个)计算任务的一个或多个矩阵操作,并且进一步使(多个)超/极稀疏片使用第二多个块来执行针对(多个)计算任务的一个或多个矩阵操作。
-