-
公开(公告)号:CN112527264A
公开(公告)日:2021-03-19
申请号:CN201910886036.7
申请日:2019-09-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构平台的常量数据访问优化方法,包括以下步骤:S1、进行中间表示降级,即结合目标后端信息对中间表示进行降级处理,将常量节点降级为目标相关的节点;S2、分析中间表示,寻找常量节点,即进行常量数据分析,对常量数据的类型、大小及范围进行计算,且根据不同的架构后端采用不用的算法进行代价评估,生成降级节点;S3、生成汇编代码,即将生成的降级中间表示翻译为指令,并建立相应的数据段。本发明实现了精细化、自动化的常量数据访问优化选择,保证程序能最大限度的利用内存,优化常量数据内存使用,使常量数据访问的性能得到进一步的提升,从而提升国产异构从核平台的性能。
-
公开(公告)号:CN110690991B
公开(公告)日:2021-03-19
申请号:CN201910852825.9
申请日:2019-09-10
Applicant: 无锡江南计算技术研究所
Abstract: 一种基于逻辑树的无阻塞网络归约计算装置,属于硬件集成电路技术领域。装置包括网络包接收模块,用于接收缓存网络上传输的归约数据包,并发送给网络包匹配模块;网络包匹配模块,用于将归约数据包的控制信息与集合消息状态记录进行匹配,匹配成功后,发送归约数据包给归约计算模块并触发归约计算模块启动计算;归约计算模块,用于进行本地归约计算和网络归约计算;网络发包模块,用于发送计算结束后的归约计算结果给归约通信指示对象。方法采用上述装置实现。本发明能够自动完成归约通信过程中的集合ID匹配,归约数据计算、归约结果发送等功能,能加速集合归约通信处理,降低集合归约通信对处理器CPU的打扰,提高集合归约通信性能。
-
公开(公告)号:CN112511461A
公开(公告)日:2021-03-16
申请号:CN202011228151.4
申请日:2020-11-06
Applicant: 无锡江南计算技术研究所 , 中国科学院计算技术研究所
IPC: H04L12/865 , H04L12/867
Abstract: 本发明公开一种面向申威平台的网络数据包的调度方法,包括以下步骤:在Linux系统内核sk_buff结构中添加用于标识优先级的pr_level字段;提供用于相同优先级内部调度的完全公平性调度策略和用于不同优先级之间调度的按优先级调度策略;按照应用需求对应用进行优先级设定;在系统内核发送数据时,根据sk_buff获取对应容器的优先级以及DEST/SRC IP端口等信息,并对该信息进行保存,之后对sk_buff的pr_level值进行设置;在系统内核发送或接收数据时,调用完全公平性调度策略或按优先级调度策略,进行网络数据包调度。本发明可以保障同级应用间的公平性和不同类应用间的区分性,以解决容器在网络上的服务质量问题。
-
公开(公告)号:CN110704362B
公开(公告)日:2021-03-12
申请号:CN201910864444.2
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
IPC: G06F15/173
Abstract: 本发明提供一种处理器阵列局部存储混合管理技术,属于计算机体系结构和处理器微结构技术领域。该处理器阵列局部存储混合管理技术包括如下步骤:S1:将阵列处理器中每个核心的片上局部存储(LDM)被划分为第一类区域、第二类区域和第三类区域;S2:将第一类区域设定为用以保存本地私有数据、其具体编址仅对本核心的应用程序可见的私有存储空间;S3:将第二类区域设定为用以保存多个核心的共享数据、其具体编址对多个核心的应用程序可见的共享存储空间;S4:将第三类区域设定为用以映射到整个主存空间、采用Cache的方式管理以使本核心的应用程序对可Cache空间的访问可见的Cache存储空间。本发明针对应用特征进行灵活配置,高效发挥应用的实际运行性能。
-
公开(公告)号:CN112446004A
公开(公告)日:2021-03-05
申请号:CN201910799250.9
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F17/11
Abstract: 本发明公开一种非结构网格DILU预条件子众核并行优化算法,包括以下步骤:S1、对所有的从核进行编号,建立众核通信模型;S2、对数组进行分块、编号,各核按块拷入数据,同时按块拷入相应的和;S3、依次确定各块的依赖关系;S4、根据依赖关系,第0块遍历计算一遍,将0号块的值全部更新,同时生成数据数组,发送至后面的块;S5、根据依赖关系,其余块接收来自前在先块的数据,遍历计算后,更新块内数据,同时生成数据数组,发送至后面的块;S6、当某一从核完成更新并将数据发送给需要的核之后,重新拷入新的块。本发明对科学计算领域常见的预条件子并行问题进行代码级优化,极大减少预处理时间,提高优化效率,对大规模线性方程组求解的性能提升效果更加显著。
-
公开(公告)号:CN112445676A
公开(公告)日:2021-03-05
申请号:CN201910832296.6
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/30
Abstract: 本发明公开一种基于带时间标签多序列的故障预测方法,包括以下步骤:从故障数据采样中获取故障类型列表;以故障类型列表作为候选序列;获得时间序列数据库;将N的初始值赋为1;计算出N项候选场景在第1条时间序列上逗留的窗口数;得到N项候选场景的支持度,比较N项候选场景的支持度与支持度阀值,删除小于支持度阀值的N项候选场景;找出所有的频繁N项场景;将所有生成的频繁场景组合成一个频繁场景集合S;计算获得置信度,比较置信度与置信度阈值,大于置信度阈值的第i个场景的真子场景与第i个场景产生形如X—>Y的规则并保存至规则列表;输出规则列表中的所有规则。本发明可以分析出可信的故障预测模型,提前感知故障,为故障前瞻处理提供重要的保证。
-
公开(公告)号:CN112445635A
公开(公告)日:2021-03-05
申请号:CN201910831840.5
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F11/07
Abstract: 本发明公开一种数据驱动的自适应检查点优化方法,包括以下步骤:以故障历史库中的故障数据作为样本,采用最大似然估计法,计算CPU节点失效分布;根据CPU节点失效分布,建立应用失效分布模型;根据失效分布模型,计算获得最优化检查点间隔;以最优化检查点间隔指导系统进行检查点;当有新故障发生时,更新相关的CPU节点失效分布;跳转至步骤二。本发明通过真实故障数据及自适应分布模型优化算法,动态更新作业级失效分布模型及其参数,不断优化并设定作业检查点间隔,自适应动态调节检查点间隔,实现对检查点容错模型的优化完善,尽量使检查点达到最优化,从而降低基于检查点的容错开销,极大提升系统可用性水平。
-
公开(公告)号:CN112445604A
公开(公告)日:2021-03-05
申请号:CN201910799249.6
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种解决非结构网格离散访存问题众核并行优化算法,包括以下步骤:S1、将网格单元周围的网格面通量数据分为若干数据块,并将不同数据块定义为不同属性;S2、将分块后的数据块并行拷入各个从核中;S3、各从核并行遍历拷入的数据块中的数据,按照该数据所对应的l(u)所在的位置,对一个数据块中的若干数据进行局部重排,并记录重排后各个数据位置索引;S4、各从核分别从主存中拷入一个通量数据块,并根据S3记录的位置索引,从重排序后的暂存空间中,拷入通量数据块所需要的Lower数据、Upper数据进行计算。本发明对非结构网格离散访存问题进行基于众核的重排序优化,极大减少了离散访存时间,提高该类问题的求解效率,从而提高整个应用系统的运行效率。
-
公开(公告)号:CN112445547A
公开(公告)日:2021-03-05
申请号:CN201910822171.5
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F9/448 , G06F15/163
Abstract: 本发明公开一种面向异构众核处理器的低扰动性能数据采集方法,用于国产众核处理器,包括以下步骤:S1、在主核设置需要采集的性能数据所对应的性能事件,并对性能事件进行分类;S2、通过CSR寄存器设置硬件计数器的初值、计数使能控制、计数事件的选择,即将性能事件选择为计数事件,以实现对硬件计数器的初始化;S3、用户对需要进行性能数据采集的程序段进行插装,通过计算获得该程序段触发该性能事件的次数为两次统计接口函数的差值;S4、主核通过读取保存在统计接口参数地址中的性能事件的计数值实现性能数据的采集。本发明可以对多类性能事件进行并行采集,大大提高了数据采集效率,实现了高效全面、对程序低扰动的性能数据采集。
-
公开(公告)号:CN112445488A
公开(公告)日:2021-03-05
申请号:CN201910831166.0
申请日:2019-09-04
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种异构平台下宽度非对称向量兼容性的编译处理方法和装置,包括以下模块:编译器预处理模块,用于对非对称异构向量的统一声明,还用于通过编译选项来控制对应的数据和接口调用的target预处理,转换为对应平台自身适应的接口;编译器前端中端分析模块,用于根据接口的调用方式,进行内部中间表示的转换或者向量降级,生成对应平台的中间表示;编译器后端拆分模块,用于根据中间表示,生成对应的后端指令。本发明实现主从核编译器向量开发的继承性、减少用户程序异构编码限制,无需去关注异构平台对向量支持的差异性。
-
-
-
-
-
-
-
-
-