-
公开(公告)号:CN108628799A
公开(公告)日:2018-10-09
申请号:CN201810344156.X
申请日:2018-04-17
Applicant: 上海交通大学
Abstract: 本发明提供一种可重构的单指令多数据脉动阵列结构、处理器及电子终端,所述单指令多数据脉动阵列结构包括:呈脉动阵列排布的多个处理单元,每一个所述处理单元对应连接有一个操作数收集器,每一个所述处理单元同与其相邻的所述处理单元均相连;多个数据输出通道,分别对应配置于每一列所述处理单元的顶端,每一列顶端的数据输出通道与对应列的第一个处理单元相连并且各数据输出通道还与每一行所述处理单元的最右侧的所述处理单元一一对应相连。本发明实现了一个可重构、低能耗结合单指令流多数据流(SIMD)、脉动阵列(Systolic Array)的处理器,通过在相邻处理单元之间建立传输通道以及多层级的存储优化,获取更低的能耗。
-
公开(公告)号:CN119149040A
公开(公告)日:2024-12-17
申请号:CN202310713862.8
申请日:2023-06-15
IPC: G06F8/41 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明提供一种图神经网络模型的编译优化方法、编译器及存储介质,所述图神经网络模型的编译优化方法包括:包括:获取输入的图神经网络模型,通过配置计算图重写规则和张量的图级语义对所述图神经网络模型的第一层级中间表示进行优化;对所述第一层级的优化输出进行计算图切分;基于切分的计算图和图感知嵌套循环体对所述图神经网络模型的第二层级中间表示进行优化。本发明能够大幅度提升GNN模型的计算性能,为基于GNN模型的广泛应用提供高性能的计算支持。
-