-
公开(公告)号:CN112631968A
公开(公告)日:2021-04-09
申请号:CN202011524240.3
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。
-
公开(公告)号:CN112631593A
公开(公告)日:2021-04-09
申请号:CN201910904073.6
申请日:2019-09-24
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开了一种基于RMA的众核分布式共享SPM实现方法,语言级共享SPM空间描述方法,由编程人员显示申明共享SPM数据;编译器对程序中的共享SPM数据的访问转换为RMA消息,根据访问特征生成对应的高效RMA操作;运行时提供高效RMA支持。本发明为用户提供分布式共享SPM变量的描述机制,并通过运行时RMA实现众核核心SPM的逻辑共享,简化众核核心间的通信,增大众核核心能够访问的高速缓存的空间;同时,充分利用众核处理器SPM和RMA的优势,简化在众核处理器上的编程,提高众核处理器的好用性、易用性,提升众核系统的可编程性。
-
公开(公告)号:CN112560356A
公开(公告)日:2021-03-26
申请号:CN201910919675.9
申请日:2019-09-26
Applicant: 无锡江南计算技术研究所
IPC: G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
-
公开(公告)号:CN112559393A
公开(公告)日:2021-03-26
申请号:CN201910910090.0
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: G06F12/1027 , G06F9/455
Abstract: 本发明公开一种基于定制TLB代换的虚拟机迁移时脏页记录方法,包括以下步骤:将虚拟机的迁移标志设置为开启,在虚拟机管理层申请“脏页缓冲区”;判断造成缺页的读写标志,如果是读标志,则需要设置TLB的只读标志位;如果是写标志,计算虚拟地址对应的宿主机页面号,并记录脏页;在数据流异常处理流程中,重填TLB,判断此时TLB是否真正具有只读标志,如果没有则需要记录脏页;否则,进入正常的数据流异常处理流程中。本发明通过虚拟地址到宿主机页面的映射关系,在特权指令模式下实现脏页记录过程,无需维护额外的影子页表,节约大量的内存资源;无需频繁虚拟机退出操作,节约大量的CPU资源,并且大幅度提高了TLB的命中率,进而提高CPU执行效率。
-
公开(公告)号:CN112559242A
公开(公告)日:2021-03-26
申请号:CN201910910081.1
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: G06F11/14 , G06F9/4401 , G06F12/02
Abstract: 本发明公开一种国产众核处理器计算核内存压缩方法,包括以下步骤:进行进程保留时,操作系统进程保留接口先调用内核级的压缩接口对进程当前使用的内存映像进行压缩,再将压缩后的内存映像数据写入检查点文件中;在进程恢复时,操作系统进程恢复接口先调用内核级的解压缩接口对检查点文件中读出的内存映像数据进行解压缩,再将解压缩后的内存映像数据恢复到进程的内存空间中。本发明解决了当前国产超级计算机中进程保留恢复耗时长,用户体验较差的问题。
-
公开(公告)号:CN112559032A
公开(公告)日:2021-03-26
申请号:CN201910910103.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于循环段的众核程序重构方法,包括基于循环段拆分的重构算法和基于循环段合并的重构算法,其中,所述基于循环段拆分的重构算法包括基于主从协同任务的循环段拆分和基于空间压缩的循环段拆分,所述基于循环段合并的重构算法包括基于相似结构的循环段合并和基于增加循环量的循环段合并。本发明根据异构系统的结构特点和性能指标,优化循环段的层次结构和顺序,充分发挥系统的性能优势,从而最大程序提高应用软件的计算性能。
-
公开(公告)号:CN112540907A
公开(公告)日:2021-03-23
申请号:CN201910892335.1
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开了一种面向异构众核上并行程序的可视化调试方法,基于异构众核处理器,包括以下步骤:S1:基于Eclipse的调试框架,形成图形化的调试客户端;S2:用户通过调试客户端指定具体的主核或从核执行调试命令;S3:此调试服务器通过socket接受来自调试客户端的调试命令;S4:用户在服务节点上部署调试代理,并执行相应的调试命令并得到调试结果数据;S5:调试服务器通过socket接收若干个调试代理输出的调试结果数据;S6:调试客户端接收来自调试服务器的信息,将带有调试结果数据的调试接口进行可视化展示。本发明能够捕获并分析归纳多进程的调试信息,使得开发人员能够通过丰富的界面交互完成对并行程序的调试,且操作简便、上手难度较低。
-
公开(公告)号:CN112100019B
公开(公告)日:2021-03-23
申请号:CN201910863431.3
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向大规模系统的多源故障协同分析定位方法,包括以下步骤:S1、对各故障监测模块采集到的故障进行统一分类,给每个故障定义一个故障编码Fid,给每个故障定义上下关联列表Fuplist和Fdownlist,上关联列表Fuplist包含一组会诱发该故障的故障编码Fid,下关联列表Fdownlist包含一组该故障会诱发的故障的Fid;S2、故障分析系统接收来自各故障监测模块发送过来的故障,形成一个当前故障列表;S3、故障分析系统对当前故障列表进行上下关联分析;S10、故障分析系统实现对一个故障Fk的精确定位,跳转S4。本发明提高了系统故障自动分析定位能力,解决了大规模并行系统故障的准确定位难题。
-
公开(公告)号:CN112527303A
公开(公告)日:2021-03-19
申请号:CN201910885728.X
申请日:2019-09-19
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向即时编译的基于动态库的GOT表管理方法,包括以下步骤:S1、创建包含GOT表的动态链接库,此GOT表位于动态链接库的数据段;S2、在即时编译引擎解析重定位前,动态载入GOT表到内存空间,并获取GOT表的首地址;S3、即时编译引擎根据程序代码段的重定位类型,进行GOT表覆写和重定位回填;S4、在程序即时编译执行结束后,动态释放包含GOT表的动态链接库;S42、退出即时编译。本发明降低了LLVM即时编译引擎对新增硬件后端中GOT表的支持难度,提高了LLVM即时编译引擎的移植效率,在基于国产处理器的LLVM即时编译引擎中快速实现了基于动态库的GOT表管理。
-
公开(公告)号:CN112486505A
公开(公告)日:2021-03-12
申请号:CN201910863206.X
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种容器化跨平台操作系统映像构建方法,包括以下步骤,构建指导描述文件,其包括软件包获取方式描述、软件包依赖关系描述、软件包准备阶段描述、软件包配置阶段描述、软件包编译阶段描述、软件包安装阶段描述;准备自动化构建工具;准备针对目标处理器体系结构的交叉编译环境;创建准备针对目标处理器软件编译的目标目录;准备交叉编译器壳程序;准备自动化构建工具壳程序;基础C语言库安装于目标目录中;根据操作系统映像所需的软件包描述文件,执行自动编译安装流程和软件库安装。本发明解决利用跨平台交叉编译技术,将完整操作系统映像在非目标处理器的平台上完整的、自动的生成。
-
-
-
-
-
-
-
-
-