-
公开(公告)号:CN1296815C
公开(公告)日:2007-01-24
申请号:CN200310102443.3
申请日:2003-10-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及指令集体系结构、二进制翻译技术领域,本发明针对二进制翻译中的解释执行提出了即时计算与延迟计算相结合的解决方法,用于优化解释执行中的标志位处理。对二进制翻译中的动态翻译提出了数据流分析和延迟计算相结合的解决方法,优化动态翻译时的标志位处理,该方法在基本翻译单元内采用数据流分析方法删除处理冗余标志位的目标代码,而在翻译单元之间采用延迟计算方法减少翻译单元之间处理冗余标志位而生成的冗余目标代码。以下简称DFADC法。通过上述两种方法,可以使翻译时减少用于仿真源ISA的标志位而产生的目标代码数量,提高了翻译代码的质量,从而使翻译执行速度得到提高。
-
公开(公告)号:CN1746849A
公开(公告)日:2006-03-15
申请号:CN200410069182.4
申请日:2004-09-10
Applicant: 中国科学院计算技术研究所
IPC: G06F9/45
Abstract: 本发明涉及一种动态二进制翻译中的翻译方法,包括以下步骤:统计寻找翻译代码中频繁出现并影响翻译质量的翻译代码片断;找出上述代码片断中的指令模式;确定指令模式的翻译对应关系;扫描待翻译的基本块,寻找所述指令模式,找到,匹配成功,给所述指令模式做标记,否则,匹配未成功,结束扫描;翻译基本块,翻译时遇到标记的指令时,按照所述指令模式的翻译对应关系翻译,否则,按照常规翻译。本发明通过指令模式匹配来翻译基本块,降低代码重复优化导致的系统开销,提高翻译质量和效果,从而提高了动态二进制翻译的性能。
-
公开(公告)号:CN111736899B
公开(公告)日:2023-09-08
申请号:CN202010474445.9
申请日:2020-05-29
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种网络处理器上寄存器的分配方法,包括:依据原始变量的被访问情况将所述原始变量划分为若干子变量;对所述子变量进行活跃性分析并构建干涉图;至少基于所述干涉图中所述子变量的最大团信息确定所述子变量的优先度,其中,所述子变量的最大团信息是指所述子变量是否包含在最大团中,所述最大团是指所述干涉图中节点所代表的子变量的长度之和最大的完全子图;以及依据所述优先度分配寄存器。
-
公开(公告)号:CN111736899A
公开(公告)日:2020-10-02
申请号:CN202010474445.9
申请日:2020-05-29
Applicant: 中国科学院计算技术研究所
IPC: G06F9/30
Abstract: 本发明提供一种网络处理器上寄存器的分配方法,包括:依据原始变量的被访问情况将所述原始变量划分为若干子变量;对所述子变量进行活跃性分析并构建干涉图;至少基于所述干涉图中所述子变量的最大团信息确定所述子变量的优先度,其中,所述子变量的最大团信息是指所述子变量是否包含在最大团中,所述最大团是指所述干涉图中节点所代表的子变量的长度之和最大的完全子图;以及依据所述优先度分配寄存器。
-
公开(公告)号:CN109933327A
公开(公告)日:2019-06-25
申请号:CN201910106880.3
申请日:2019-02-02
Applicant: 中国科学院计算技术研究所
IPC: G06F8/41
Abstract: 本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统,包括:基于共享内存提供主机-内核代码融合编译框架,在编译器的中间表示——AST层上实现不同端代码的融合;WII-CFG图用来刻画Kernel代码被实例化成众多线程后,线程之间的指令执行行为,亦即分析工作组内平台特征敏感的程序执行行为;主机-内核代码联合的数据流分析,用来发掘跨越主机端或内核端的数据流关系以及线程之间的数据流关系,以分析两端代码之间的数据相关性;基于前述分析实施针对性的代码优化,并生成汇编代码进而结束编译过程。本发明能面向不同加速设备,针对主机端代码、Kernel代码同时开展分析,充分发掘线程间优化机会,使得OpenCL程序获得良好的性能可移植性。
-
公开(公告)号:CN109901840A
公开(公告)日:2019-06-18
申请号:CN201910114572.5
申请日:2019-02-14
Applicant: 中国科学院计算技术研究所
IPC: G06F8/41
Abstract: 本发明通过自动选择优化策略以及分维度进行线程间冗余删除的收益代价分析,能自动根据代码是否含有同步操作和硬件平台的特点,针对性地选择一种优化策略,通过对Kernel代码的编译分析,得出合适的合并维度和合并因子,利于提高Kernel代码的运行性能。采用本发明方法能面向多种异构平台,进行自动分析和变换,得以优化设备端代码的线程间冗余和同步开销,提高设备端代码(即OpenCL的Kernel代码)的性能。
-
公开(公告)号:CN106201874B
公开(公告)日:2018-12-28
申请号:CN201610527181.2
申请日:2016-07-06
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F11/36
Abstract: 本发明实施例提供一种并行程序的MHP分析方法和装置,一种并行程序的MHP分析方法包括:从待分析并行程序的主线程开始,每次选择一个线程,模拟待分析并行程序的执行,其中,当正在模拟执行的线程无法继续执行时,跳转至任一可继续执行的线程模拟执行,直至待分析并行程序的所有线程模拟执行完毕,其中,待分析并行程序包括至少两个线程;根据对待分析并行程序进行模拟执行的结果,构建与待分析并行程序对应的多线程控制流图;对多线程控制流图进行处理,得到保守正确的多线程控制流图,保守正确的多线程控制流图中的各节点的可能并发MHP结果不存在漏报;对保守正确的多线程控制流图进行MHP分析,得到待分析并行程序的MHP分析结果。
-
公开(公告)号:CN108845960A
公开(公告)日:2018-11-20
申请号:CN201810316306.6
申请日:2014-10-22
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F12/0811 , G06F12/0882
CPC classification number: G06F3/0605 , G06F3/0631 , G06F3/0644 , G06F3/0653 , G06F3/0679 , G06F9/5016 , G06F11/3409 , G06F11/3433 , G06F11/3471 , G06F12/0811 , G06F12/084 , G06F12/0842 , G06F12/0897 , G06F2201/81 , G06F2212/1041 , G06F2212/282 , G06F2212/6042 , G06F2212/653
Abstract: 本发明的实施例提供一种存储器资源优化方法和装置,涉及计算机领域,解决了现有多级存储器资源之间存在的相互影响问题,优化了现有单一的划分机制。具体方案为:通过页着色技术获得工作集中各程序的性能数据,结合访存频度得到各程序的分类,根据各程序的分类选择工作集对应的页着色划分策略,并将页着色划分策略输入操作系统内核,完成相应的着色划分处理。本发明用于结合工作集特点消除或降低进程、线程在存储资源上的相互干扰,提高了计算机的整机性能。
-
公开(公告)号:CN104239126B
公开(公告)日:2018-03-13
申请号:CN201310244090.4
申请日:2013-06-19
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/46
Abstract: 本发明实施例提供了一种有向图的最小割获取方法和设备,通过具有依次包含关系的子图的形式对结点集合进行有向图最小割获取的方法和设备,减少了并行计算时的活跃结点间的通信次数和同步次数,提高了性能,其中该方法包括:按照预设策略,分别将有向图划分成至少两个汇点子图和至少两个源点子图;并行计算全部汇点子图的最小割集并通过汇点子图之间的通信获得有向图的等效汇点,以及并行计算全部源点子图的最小割集并通过源点子图之间的通信获得有向图的等效源点;根据有向图的等效汇点和有向图的等效源点连接的所有边获取有向图的最小割。
-
公开(公告)号:CN104866295B
公开(公告)日:2018-03-06
申请号:CN201410065503.7
申请日:2014-02-25
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/44
Abstract: 本发明实施例公开了一种OpenCL运行时系统框架的设计方法及装置,涉及信息技术领域,可以降低异构系统的平台开发复杂度。所述方法包括:首先将OpenCL运行时系统框架划分为功能层、优化层及平台层,平台层包括平台层中间表示IR、平台层实现框架及至少一个平台实现,然后向功能层及优化层提供平台层IR,并向至少一个平台实现提供平台层实现框架。本发明实施例适用于在异构系统中进行跨平台移植。
-
-
-
-
-
-
-
-
-