-
公开(公告)号:CN115795252A
公开(公告)日:2023-03-14
申请号:CN202211631741.0
申请日:2022-12-19
Applicant: 湖南科技大学
Abstract: 本发明涉及一种基于向量处理器的QR分解后的向量乘法实现方法,所针对的QR分解算法为VSIP库函数中的vsip_cqrd_f函数,VSIP库是GE智能平台推出的向量、信号和图像处理库,是专为需要使用强化型信号和图像处理的开发人员而提供的开放标准应用程序编程接口。本发明的技术方案主要包括如下步骤:步骤一、输入矩阵C;步骤二、对A矩阵进行预处理,运算得到向量;步骤三、根据数量大小采取不同处理方案,实现向量与向量的乘法运算,当数据量极小时,将直接在DDR内通过标量处理,当数据量未超过cache尺寸,将矩阵C与向量V通过DMA传输传入cache中进行乘法运算,当数据量超过cache尺寸时,采用传输和计算并行方式进行乘法运算;步骤四、向量cI与矩阵的每行做乘法运算,根据数量大小采取不同处理方案,更新输出矩阵。本发明针对向量处理器拥有较大存储空间、片内高速缓存、丰富指令集以及高效快捷的数据传输的优点,设计并实现了针对QR分解后的向量乘法,在进行相关运算中发挥出较大的优势。
-
公开(公告)号:CN115795251A
公开(公告)日:2023-03-14
申请号:CN202211628879.5
申请日:2022-12-18
Applicant: 湖南科技大学
Abstract: 本发明涉及一种基于向量处理器的QR分解后的矩阵向量乘法实现方法,所针对的QR分解算法为VSIP库中的vsip_cqrd_f函数,VSIP库是GE智能平台推出的向量、信号和图像处理库,是专为需要使用强化型信号和图像处理的开发人员而提供的开放标准应用程序编程接口。本发明的技术方案主要包括如下步骤:步骤一、判断输入矩阵C是否需要转置共轭处理及矩阵C在矩阵乘法的左还是右,以此进入不同分支处理;步骤二、对A矩阵进行预处理;步骤三、根据数量大小采取不同处理方案,实现矩阵与向量乘法运算。本发明针对向量处理器拥有较大存储空间、片内高速缓存、高效快捷的数据传输的优点,设计并实现了针对QR分解后的矩阵向量乘法,在复杂矩阵运算中可发挥出较大的优势。
-