-
公开(公告)号:CN119166948A
公开(公告)日:2024-12-20
申请号:CN202411629645.1
申请日:2024-11-15
Applicant: 之江实验室
IPC: G06F17/10 , G06N3/0499 , G06N3/084 , G06N3/063
Abstract: 本发明公开一种众核环境下自适应的dw类型算子数据分布方法和装置,通过获取参与计算的硬件设备参数以及计算任务参数,根据x和dy的形状搜索适应硬件设备参数的数据分布;根据数据分布和单次取数大小,将输入数据划分为多个块进行计算,最后根据得到的数据分布选择规约维度和连接写回维度写回。本发明能够针对计算芯片和参与计算的数据参数,自适应的搜索适应计算的数据分布,从而减少了因数据分布不合理导致的额外数据传输的开销,从而优化了算子性能。