一种低显存下的矩阵及其转置的快速乘法

    公开(公告)号:CN115495045A

    公开(公告)日:2022-12-20

    申请号:CN202211079323.5

    申请日:2022-09-05

    Inventor: 汤颖 张锦添

    Abstract: 一种低显存下的矩阵及其转置快速乘法方法,包括:1)根据获得的矩阵数据,将其按照规定格式存储在文本文件中,采用快速读入模块将矩阵数据读入到内存中;2)将步骤1)中的原始矩阵传入到显存,并对答案矩阵进行化简、向量化、分组,传入到显存;3)组内进行并行计算,组间进行串行计算;4)步骤3)所得到的多个数组进行合并,并与答案矩阵进行转换,输出最终解。本发明能在硬件的显存大小较低的情况下,利用GPU的并行计算框架,充分发挥显卡的性能,快速地完成大规模矩阵及其转置乘法。

Patent Agency Ranking