-
公开(公告)号:CN112527393A
公开(公告)日:2021-03-19
申请号:CN201910879804.6
申请日:2019-09-18
Applicant: 无锡江南计算技术研究所
IPC: G06F9/38
Abstract: 本发明公开一种面向主从融合架构处理器的指令调度优化装置和方法,基于以下模块:指令调度模块,用于接收含有目标机信息和指令序列的代码,还用于根据指令模板选择器提供的指令模板,对接收到的指令序列进行调度;指令模板选择器,用于接收代码中的目标机信息,并根据目标机信息,选择主核指令模板或者从核指令模板,将选择好的指令模板发送给指令调度模块;主核指令模板,用于描述主核指令的指令类型、指令的目标信息、可以在哪条流水线上执行该指令以及指令延迟信息;配置于编译器后端的从核指令模板。本发明进一步降低流水线阻塞发生的概率,优化处理器的指令调度过程,提高指令调度的准确性以及指令调度的性能指标,实现指令调度过程的优化。
-
公开(公告)号:CN112527264A
公开(公告)日:2021-03-19
申请号:CN201910886036.7
申请日:2019-09-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构平台的常量数据访问优化方法,包括以下步骤:S1、进行中间表示降级,即结合目标后端信息对中间表示进行降级处理,将常量节点降级为目标相关的节点;S2、分析中间表示,寻找常量节点,即进行常量数据分析,对常量数据的类型、大小及范围进行计算,且根据不同的架构后端采用不用的算法进行代价评估,生成降级节点;S3、生成汇编代码,即将生成的降级中间表示翻译为指令,并建立相应的数据段。本发明实现了精细化、自动化的常量数据访问优化选择,保证程序能最大限度的利用内存,优化常量数据内存使用,使常量数据访问的性能得到进一步的提升,从而提升国产异构从核平台的性能。
-
公开(公告)号:CN112445488A
公开(公告)日:2021-03-05
申请号:CN201910831166.0
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种异构平台下宽度非对称向量兼容性的编译处理方法和装置,包括以下模块:编译器预处理模块,用于对非对称异构向量的统一声明,还用于通过编译选项来控制对应的数据和接口调用的target预处理,转换为对应平台自身适应的接口;编译器前端中端分析模块,用于根据接口的调用方式,进行内部中间表示的转换或者向量降级,生成对应平台的中间表示;编译器后端拆分模块,用于根据中间表示,生成对应的后端指令。本发明实现主从核编译器向量开发的继承性、减少用户程序异构编码限制,无需去关注异构平台对向量支持的差异性。
-
公开(公告)号:CN112445479A
公开(公告)日:2021-03-05
申请号:CN201910794733.X
申请日:2019-08-27
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种针对结构体成员的重组优化方法,包括以下步骤:S11、编译器扫描目标程序中的每个基本块,构建待优化的结构体类型集合;S12、对程序中所有结构体的引用进行分析,从待优化的结构体类型集合中移除不满足优化条件的结构体类型;S13、根据结构体定义、声明以及引用的信息对满足优化条件的结构体的成员进行重组,并将结果记录在sbitmap类型的变量中;S14、根据步骤S13记录的待重组的结构体成员的信息,创建多个新结构体的定义;S15、遍历目标程序的所有基本块,将目标程序中对旧结构体的引用替换为对新结构体的引用,对结构体声明及引用信息进行更新。本发明解决了现有的数据变换技术无法针对结构体成员进行数据重组优化的问题,达到了进一步提升数据Cache性能的效果。
-
公开(公告)号:CN112445316A
公开(公告)日:2021-03-05
申请号:CN201910794732.5
申请日:2019-08-27
Applicant: 无锡江南计算技术研究所
IPC: G06F1/3234 , G06F8/41
Abstract: 本发明公开一种基于向量计算的编译时低功耗优化方法,包括以下步骤:编译器读入源程序,通过词法分析、语法分析、语义分析、控制流分析、数据流分析的优化分析手段,识别出向量计算参数为常量的情况并进行标记;编译器在分析出向量计算表达式中参数为立即数向量时,在进行表达式匹配时,调用向量静态预计算库进行计算,然后用计算后的结果替换原有的表达式;编译器分析出向量计算中参数为赋初值变量或者常量变量时,调用向量静态预计算库进行计算,然后用计算后的结果替换原有的表达式。本发明实现在编译时尽量挖掘向量数据的预计算能力的目的,挖掘向量数据的预计算能力,减少运行时的向量访存与计算,提高程序性能,降低处理器能耗。
-
公开(公告)号:CN105279004B
公开(公告)日:2018-06-26
申请号:CN201510830299.8
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41 , G06F9/445 , G06F12/0802
Abstract: 本发明提供了一种基于采样剖析的轻量级程序代码重排方法,包括:编译链接程序,其中预留一段代码空间;加载器读入目标程序;使得目标程序运行一遍,加载器收集目标程序运行时运行信息;利用收集到的运行信息指导代码重排;对代码执行垫塞优化;将垫塞优化后的代码写进新的目标程序。
-
公开(公告)号:CN102929707B
公开(公告)日:2015-10-07
申请号:CN201210438264.6
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种并行任务动态分配方法,适用于包括多级用户进程的并行系统,所述多级用户进程包括至少两级主进程和普通进程。该方法包括:主进程将本级待分配的并行任务排序,形成本级待分配任务队列;接收下一级用户进程发送的任务请求消息及所请求的任务数量;从本级待分配任务队列的队首开始,按照下一级用户进程所请求的任务数量,为下一级用户进程分配任务,并更新本级待分配任务队列。本发明可提高动态任务分配的效率,以达到众多计算资源间的负载平衡。
-
公开(公告)号:CN102981839A
公开(公告)日:2013-03-20
申请号:CN201210441329.2
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种合并执行大规模并行线程的数据扩展优化方法,包括:在合并执行的并行线程中识别线程不变量;所述线程不变量在每个合并执行的并行线程中保持一致;编译过程中,仅对非线程不变量,进行数据扩展。本发明减少了不必要的线程私有数据扩展,能有效缓解合并后栈空间的剧烈膨胀,提高程序的执行效率。
-
-
-
-
-
-
-