-
公开(公告)号:CN112738142A
公开(公告)日:2021-04-30
申请号:CN201910974455.6
申请日:2019-10-14
Applicant: 无锡江南计算技术研究所
IPC: H04L29/08
Abstract: 本发明公开了一种面向众核多层次存储系统的数据高效传输支持方法,包括典型访存通信模式性能库和运行时最优模式选择模块,所述典型访存通信模式性能库是通过以下步骤构建形成的,总结科学计算程序中的典型通信访存模式;对每种典型通信访存模式,用多种通信访存方案具体实现;对每种实现通信访存方案,测试在不同数据规模下的性能以及需要的缓冲空间的大小,构建典型访存通信模式性库;所述运行时最优模式选择模块则根据用户程序的访存通信模式、访存数据量、可用缓冲空间大小信息,搜索典型访存通信模式性库,选择最优实现方案。本发明减轻编程人员负担的同时,提供高效的实现方案,对于不了解存储系统细节的编程人员,也能很好的利用系统特性。
-
公开(公告)号:CN112631693A
公开(公告)日:2021-04-09
申请号:CN201910903881.0
申请日:2019-09-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种运行时计算资源动态扩展方法,发送资源扩展升级命令给正在运行的原课题;原节点接到升级信号后,进行通信环境清理;等待新进计算资源进行二次通信环境重构通信;新节点由作业管理启动程序,进入动态任务划分区域中;判断为资源升级新节点后,新节点进行通信环境清理;原节点与新节点进行二次通信环境重构;新节点按照动态任务划分规则自动进行分区,选取分区主节点,由分区主节点向全局主节点申请任务;全局主节点在接到原分区和新分区主节点的任务申请后,向原计算资源节点和新计算资源节点均匀分配任务,课题继续正常运行。本发明解决资源调整后的通信环境重构问题,在不中断已运行课题的基础上将空闲的计算资源分配给该课题,并动态分配未完成的任务,达到计算资源的最大化利用。
-
公开(公告)号:CN112565474B
公开(公告)日:2024-02-06
申请号:CN201910910495.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
IPC: H04L61/2596 , H04L67/1097
Abstract: 本发明公开一种面向分布式共享SPM的批量数据传输方法,传输前读取SPM可用空间大小,若SPM的可用空间足够,执行下一步;将共享SPM起始目的地址转换为SPM局部地址,根据分布式共享SPM地址编址方法计算得到对应的物理SPM号和SPM内的局部地址;根据SPM局部地址计算对应物理SPM的可传输数据量,由所述SPM号对应线程发起批量数据传输,将批量数据从主存传输至物理SPM;数据传输完成后,更新下一轮传输的起始地址,以及剩余总传输数据量;将在下一轮传输的中计算;当spm_size_free_total
-
公开(公告)号:CN112559197B
公开(公告)日:2022-11-15
申请号:CN201910852525.0
申请日:2019-09-10
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块,第(i,j)号内核将第(j,i)块数据从内存读取到自己的片上存储器内,数据块C(i,j)的卷积计算需要数据块A(i,k)和数据块B(k,j),其中k=1,2,……,N;S2、进入循环k,循环次数从1到N,共N次,利用得到的数据块A、数据块B完成数据块C的第K次卷积计算。本发明显著降低卷积计算在异构众核处理器上的内存访存需求,充分发挥众核计算能力,从而实现卷积计算高性能,提升其在异构众核处理器上的计算性能。
-
公开(公告)号:CN112416313B
公开(公告)日:2022-07-12
申请号:CN201910782836.4
申请日:2019-08-23
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种支持大整数数据类型和运算符的编译方法,基于GCC编译器,包括以下步骤:对GCC编译器做如下配置:扩展GCC编译器内部预定义宏,增加大整数数据类型的预定义宏;扩展GCC编译器的关键字,增加大整数数据类型关键字ccc_bint,并利用编译器的attribute机制来设置大整数类型属性;扩展GCC编译器前端,增加对大整数数据类型关键字ccc_bint的识别,使得编译器在词法分析阶段可以通过大整数数据类型相关程序的词法分析;扩展GCC编译器前端,增加对大整数数据类型关键字表达式的语法分析操作,使得编译器为大整数数据类型关键字相关的赋值表达式、运算表达式、初始化表达式等进行正确的语法分析。本发明既大大提高了运算的进度,又提高了对计算机系统资源利用的效率,改善了计算机运行的性能。
-
公开(公告)号:CN114217764A
公开(公告)日:2022-03-22
申请号:CN202110479704.1
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于国产异构众核平台的高精度浮点数模拟方法,包括以下步骤:S1、初始数据类型的转换与表示:利用数据类型转换函数实现源数据类型到高精度浮点数的转换;S2、根据具体功能,对符号位、指数位以及尾数分别进行相应的运算,并用指令进行加速;S3、对S2中的结果进行就近取偶舍入,并根据舍入结果对指数进行调整,得到高精度浮点运算的结果。本发明降低了用户的编程难度,使得高精度浮点运算的实现指令条数更少,计算效率更高。
-
公开(公告)号:CN112636765A
公开(公告)日:2021-04-09
申请号:CN201910903873.6
申请日:2019-09-24
Applicant: 无锡江南计算技术研究所
IPC: H03M7/42
Abstract: 本发明公开了一种基于数据压缩存储的细粒度并行查表方法,包括以下步骤,原始数据压缩,将原细元素粒度的表按照其粒度压缩存储为int类型的表X;根据原表元素粒度生成不同的掩码表Y;根据原表元素粒度对原查表偏移进行处理,得到偏移量为A和B;按查表偏移A按int类型并行查表X,得到查表结果X1;按查表偏移B按int类型并行查表Y,得到查表结果Y1;对X1和Y1进行逻辑运算及移位操作得到最终查表结果。本发明是对用户原始细粒度表元素合并压缩存储,通过增加简单逻辑运算及移位运算实现细粒度的并行查表功能,有效避免以int为单位进行查表导致的空间膨胀,大大提升了具有细粒度查表类课题的向量并行优化的可能性。
-
公开(公告)号:CN112579090A
公开(公告)日:2021-03-30
申请号:CN201910927243.2
申请日:2019-09-27
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开了异构众核架构下的异步并行I/O编程框架方法,在控制核心函数中注册运算核心代理写文件函数;控制核心函数中异步调用运算核心函数;运算核心函数在执行工作时,判断运算核心的上次写文件是否完成,如写文件完成,运算核心向控制核心发送写文件中断信号;如写文件未完成,运算核心将要执行写文件内容作为参数,向控制核心发送写文件中断信号;控制核心在执行工作时,如收到运算核心发出写文件中断信号,则保留当前工作状态,执行代理写文件函数,实现控制核心对运算核心写文件的异步代理功能。本发明运算核心使用发送信号的方式通知控制核心完成异步代理写文件功能,从而提高控制核心的执行效率。
-
公开(公告)号:CN112565474A
公开(公告)日:2021-03-26
申请号:CN201910910495.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向分布式共享SPM的批量数据传输方法,传输前读取SPM可用空间大小,若SPM的可用空间足够,执行下一步;将共享SPM起始目的地址转换为SPM局部地址,根据分布式共享SPM地址编址方法计算得到对应的物理SPM号和SPM内的局部地址;根据SPM局部地址计算对应物理SPM的可传输数据量,由所述SPM号对应线程发起批量数据传输,将批量数据从主存传输至物理SPM,传输的数据量spm_tran_len为spm_size_free_local和spm_size_free_total之间的最小值;数据传输完成后,更新下一轮传输的起始地址spm_addr_start=spm_addr_start+spm_tran_len,以及剩余总传输数据量spm_size_free_total=spm_size_free_total‑spm_tran_len;将在下一轮传输的中计算;当spm_size_free_total
-
公开(公告)号:CN112540855A
公开(公告)日:2021-03-23
申请号:CN201910891116.1
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54
Abstract: 本发明公开了一种通信域的集中式管理方法,创建通信域数据结构;通信域的根进程向全局主进程发起申请,全局主进程收到申请后分配管理索引;全局主进程收从资源列表中读取资源信息,通过通信优化策略从资源列表中选择生成可用资源信息,并通知根进程;将生成可用资源信息加入全局通信域队列中;用户发起消息,运行时库使用本进程通信域队列中的可用资源信息读写数据和通信;发送消息后,运行时库通过轮询本进程通信域队列中消息状态,状态异常的消息触发容错流程。本发明将创建的通信域进行集中式管理的机制,有助于提高物理和软件资源利用效率,在通信域的数据结构中添加可用资源信息,帮助用户实现资源的高效利用和对程序运行状态的查询。
-
-
-
-
-
-
-
-
-