-
公开(公告)号:CN115421685A
公开(公告)日:2022-12-02
申请号:CN202211251366.7
申请日:2022-10-13
Applicant: 国家超级计算无锡中心
Abstract: 本发明提供的基于可编程硬件浮点库的FPGA加速方法,涉及FPGA的加速方法技术领域,包括采用dspfloat数据类型;dspfloat数据类型包括1位宽比特的符号位、指数位和尾数位;符号位的值为0表示正数,符号位的值为1表示负数;指数位为NEXP比特;尾数位为NFRAC比特;指数位采用补码的方式存储;尾数位表示浮点的有效数据,隐藏高位比特1;指数位、尾数位的位宽可以进行自定义。本发明提供的dspfloat的指数位宽和尾数位宽可以进行自定义,规避了float数据类型精度不足和double数据类型位宽过大的缺陷,在保证应用需求精度的基础上,达到更高的频率,减少计算资源占用,提高计算速度。
-
公开(公告)号:CN119149449A
公开(公告)日:2024-12-17
申请号:CN202411167068.9
申请日:2024-08-23
Applicant: 国家超级计算无锡中心 , 无锡恒鼎超级计算中心有限公司
IPC: G06F12/0871 , G06F16/22
Abstract: 本发明提供的一种基于十字链表算法的局部化全局动态数据方法,涉及缓存领域,包括步骤:为全局动态数据中每个次关键字创建一个firstn节点,firstn节点设置局部索引,用于指向次关键字在数据元素中处于第n个位置的第一个数据元素;为数据元素中每个次关键字创建一个next数据项,next数据项设置局部索引,指向次关键字在数据元素中处于相同位置的下一个数据元素;遍历所有的数据元素通过头插法构建以firstn节点为头节点的链表,将链表组织成多组局部动态数据;将局部动态数据以及与次关键字相关的数据依次从片外缓存传输到片上缓存。本发明能够解决现有技术访问查找表时,数据访问延迟大、算法时间复杂度高的问题,实现降低数据访问延迟,调高计算效率。
-
公开(公告)号:CN112231630A
公开(公告)日:2021-01-15
申请号:CN202011156271.8
申请日:2020-10-26
Applicant: 国家超级计算无锡中心 , 太初(无锡)电子科技有限公司
Abstract: 本发明提供的基于FPGA并行加速的稀疏矩阵求解方法,通过对稀疏矩阵进行分解、对下三角矩阵对角线元素取倒数、根据数据依赖关系对数据进行分割分配、并对每个处理单元内的数据进行排布、依据排布的运算顺序采用精确的节拍级硬件资源调度进行计算,从而实现高度融合的软硬件协同加速、稀疏矩阵求解的细粒度并行流水,有效解决了现有技术中存在的处理效率低、浪费计算资源、甚至无法进行计算的问题,节省计算资源、提高处理效率。
-
公开(公告)号:CN112231630B
公开(公告)日:2024-02-02
申请号:CN202011156271.8
申请日:2020-10-26
Applicant: 国家超级计算无锡中心 , 太初(无锡)电子科技有限公司 , 国网湖北省电力有限公司
Abstract: 本发明提供的基于FPGA并行加速的稀疏矩阵求解方法,通过对稀疏矩阵进行分解、对下三角矩阵对角线元素取倒数、根据数据依赖关系对数据进行分割分配、并对每个处理单元内的数据进行排布、依据排布的运算顺序采用精确的节拍级硬件资源调度进行计算,从而实现高度融合的软硬件协同加速、稀疏矩阵求解的细粒度并行流水,有效解决了现有技术中存在的处理效率低、浪费计算资源、甚至无法进行计算的问题,节省计算资源、提高处理效率。(56)对比文件Fialko Sergiy.Parallel direct solverfor solving systems of linear equationsresulting from finite element method onmulti-core desktops and workstations.《Computers & Mathematics withApplications》.2015,第70卷(第12期),2968-2987.Chai Wenwen 等.An LU decompositionbased direct integral equation solver oflinear complexity and higher-orderaccuracy for large-scale interconnectextraction《.IEEE Transactions on AdvancedPackaging》.2010,第33卷(第4期),794-803.陈尧 等.GPU加速不完全Cholesky分解预条件共轭梯度法《.计算机研究与发展》.2015,(第04期),843-850.
-
-
-