-
公开(公告)号:CN117093814A
公开(公告)日:2023-11-21
申请号:CN202311054523.X
申请日:2023-08-21
Applicant: 鹏城实验室
IPC: G06F17/16 , G06F12/0842 , G06F11/34
Abstract: 本申请实施例公开了一种数据处理方法、装置、计算机可读存储介质及计算机设备。包括:确定当前迭代区内第一子矩阵对应的第一输入矩阵和第二输入矩阵;根据第一输入矩阵和第二输入矩阵确定出第一迭代区内的第一个子迭代区的目标第二子矩阵,第一迭代区和当前迭代区域相邻;根据目标第二子矩阵对第一迭代区内至少一个子迭代区进行迭代,得到对应的第三输入矩阵和第四输入矩阵;根据第一输入矩阵、第二输入矩阵以及第三输入矩阵和第四输入矩阵确定出目标迭代区的目标选定子矩阵,目标迭代区与当前迭代区和第一迭代区均不相邻。从而避免在每个迭代区依次迭代都要对全局内存读写一次,减少对处理器的全局内存的读写次数,充分发挥计算机设备的性能。
-
公开(公告)号:CN115185587A
公开(公告)日:2022-10-14
申请号:CN202210598490.4
申请日:2022-05-30
Applicant: 鹏城实验室
Abstract: 本发明涉及矩阵处理技术领域,具体是涉及一种基于AI处理器的通用矩阵乘算子的处理方法和装置。依据原矩阵中的设定元素,在CPU上计算出输入矩阵;将所述输入矩阵搬运至所述全局内存;将搬运至所述全局内存的输入矩阵和位于所述全局内存上的矩阵作为通用矩阵乘算子的输入,得到所述通用矩阵乘算子的输出矩阵。本发明在AI处理器上通过通用矩阵乘算子处理矩阵,能够使得AI处理器的计算资源得到充分利用,从而提高了处理矩阵的速度和效率。
-