-
公开(公告)号:CN119090700A
公开(公告)日:2024-12-06
申请号:CN202411177248.5
申请日:2024-08-26
Applicant: 之江实验室
Abstract: 本发明涉及一种面向图计算的优先级感知处理方法和硬件加速器,方法包括:接收待处理的图数据,遍历图数据中的每个顶点,为各顶点的所有邻接边进行优先级预测,并按照优先级预测结果对所有邻接边进行重排序;根据每个顶点所有邻接边的重排序结果,对各邻接边进行分级存储;同时调度多个顶点进行并行计算,且对每个顶点中依次优先从高优先级的存储区域中调度邻接边进行任务处理,若处理得到的顶点状态收敛到最终结果,则跳过当前顶点剩下的未被遍历的所有邻接边。与现有技术相比,本发明能在很大程度上减少冗余计算问题,在保持高并行度的前提下提升计算效率,加快图计算处理速度,同时软硬件协同的设计方案具有高吞吐率,优化了性能表现。
-
公开(公告)号:CN118797227A
公开(公告)日:2024-10-18
申请号:CN202410871937.X
申请日:2024-07-01
Applicant: 之江实验室
Abstract: 本发明涉及一种面向稀疏矩阵乘法的矩阵划分方法和硬件加速器,方法包括通过自适应的矩阵划分调度策略对矩阵进行划分,对待乘矩阵A与B进行基于负载感知的重排序,在重排序后的矩阵上进行基于滑动窗口的自适应划分,对矩阵划分方案进行敏捷评估,得出最优矩阵划分方案;通过面向稀疏矩阵乘法的通用硬件加速器对划分得到数据进行运算,通过缓存调度设计预取并调度矩阵划分块数据,通过高效写回合并设计将计算数据高效合并同时快速写回。与现有技术相比,本发明的矩阵划分方法能在很大程度上降低随机访存占比,提高计算流水线吞吐量,加快矩阵相乘速度;硬件加速器具有高灵活性和高效率,优化了性能表现。
-