-
公开(公告)号:CN112565474A
公开(公告)日:2021-03-26
申请号:CN201910910495.4
申请日:2019-09-25
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向分布式共享SPM的批量数据传输方法,传输前读取SPM可用空间大小,若SPM的可用空间足够,执行下一步;将共享SPM起始目的地址转换为SPM局部地址,根据分布式共享SPM地址编址方法计算得到对应的物理SPM号和SPM内的局部地址;根据SPM局部地址计算对应物理SPM的可传输数据量,由所述SPM号对应线程发起批量数据传输,将批量数据从主存传输至物理SPM,传输的数据量spm_tran_len为spm_size_free_local和spm_size_free_total之间的最小值;数据传输完成后,更新下一轮传输的起始地址spm_addr_start=spm_addr_start+spm_tran_len,以及剩余总传输数据量spm_size_free_total=spm_size_free_total‑spm_tran_len;将在下一轮传输的中计算;当spm_size_free_total
-
公开(公告)号:CN112540855A
公开(公告)日:2021-03-23
申请号:CN201910891116.1
申请日:2019-09-20
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54
Abstract: 本发明公开了一种通信域的集中式管理方法,创建通信域数据结构;通信域的根进程向全局主进程发起申请,全局主进程收到申请后分配管理索引;全局主进程收从资源列表中读取资源信息,通过通信优化策略从资源列表中选择生成可用资源信息,并通知根进程;将生成可用资源信息加入全局通信域队列中;用户发起消息,运行时库使用本进程通信域队列中的可用资源信息读写数据和通信;发送消息后,运行时库通过轮询本进程通信域队列中消息状态,状态异常的消息触发容错流程。本发明将创建的通信域进行集中式管理的机制,有助于提高物理和软件资源利用效率,在通信域的数据结构中添加可用资源信息,帮助用户实现资源的高效利用和对程序运行状态的查询。
-
公开(公告)号:CN112486424A
公开(公告)日:2021-03-12
申请号:CN201910861483.7
申请日:2019-09-12
Applicant: 无锡江南计算技术研究所
IPC: G06F3/12
Abstract: 本发明公开了一种用户透明的运算核并行打印保序代理方法,对运算核上的打印输出语句进行扩展替换,将打印输出语句变换成调用运行时系统中的线程打印处理函数;对线程打印处理函数进行参数解析,申请数据转存缓冲区,根据参数类型进行数据转存;运算核请求控制核进行打印保序代理,将申请的数据转存缓冲区首地址传送给控制核;控制核接到中断信号,转入中断处理,根据数据转存缓冲的参数类型执行嵌汇编指令装填打印函数参数,调用printf代理实现运算核打印输出。本发明采用编译器和运行时相结合,自动完成所有运算核的并行有序输出;对用户透明且不需要对运算核的打印输出进行额外管理;只需要运算核的基础编译器对运算核程序进行简单的程序变换即可。
-
公开(公告)号:CN112433965A
公开(公告)日:2021-03-02
申请号:CN201910788897.1
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
IPC: G06F12/0897 , G06F12/0871
Abstract: 本发明公开一种面向SPM存储层次的数据缓存实现方法,包括以下步骤:S1、建立数据缓存的编程描述;S2、编译器分析编译指示,确定循环分块参数LoopBlockKey;S3、编译器根据S2中获得的循环分块参数,计算每一个循环块的计算、访存开销与数据传送开销的比值,得到并行隐藏参数Hkey;S4、根据S3得到的并行隐藏参数,反馈修正,得到最终的循环分块参数;S5、根据循环分块参数和并行隐藏参数,选择循环重构策略进行循环重构。本发明有效提升了编译器的上下文分析精确度和应用的访存效率,且可以做到计算与不同存储层次间的数据传送并行进行,有效利用处理器的各个存储层次,更进一步提升程序性能。
-
公开(公告)号:CN114217913B
公开(公告)日:2025-05-20
申请号:CN202110325187.2
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F9/48
Abstract: 本发明公开一种异构众核架构下的任务动态分配异步管理方法,包括以下步骤:S1、运算核心向控制核心发送任务请求;S2、初始化任务池;S3、判断任务请求类型是计算任务还是控制代理任务;S4、控制核心响应运算核心请求,分配任务至运算核心;S5、控制核心继续本地任务,运算核心接收来自控制核心的任务序号,执行对应任务;S6、向控制核心发送任务完成报告信号;S7、更新任务池;S8、运算核心查询是否更新任务;S9、控制核心继续执行本地任务;S10、等待所有任务执行完毕或得到最终结果,通知计算核心退出。本发明解决了控制核心需要通过轮询等方式主动查看任务完成状态,而不能进行其他操作的问题。
-
公开(公告)号:CN112433965B
公开(公告)日:2022-07-12
申请号:CN201910788897.1
申请日:2019-08-26
Applicant: 无锡江南计算技术研究所
IPC: G06F12/0897 , G06F12/0871
Abstract: 本发明公开一种面向SPM存储层次的数据缓存实现方法,包括以下步骤:S1、建立数据缓存的编程描述;S2、编译器分析编译指示,确定循环分块参数LoopBlockKey;S3、编译器根据S2中获得的循环分块参数,计算每一个循环块的计算、访存开销与数据传送开销的比值,得到并行隐藏参数Hkey;S4、根据S3得到的并行隐藏参数,反馈修正,得到最终的循环分块参数;S5、根据循环分块参数和并行隐藏参数,选择循环重构策略进行循环重构。本发明有效提升了编译器的上下文分析精确度和应用的访存效率,且可以做到计算与不同存储层次间的数据传送并行进行,有效利用处理器的各个存储层次,更进一步提升程序性能。
-
公开(公告)号:CN114327808A
公开(公告)日:2022-04-12
申请号:CN202110425774.9
申请日:2021-04-20
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种自适应任务调度方法,包括在课题开始运行后运行时系统对计算资源进行初始化,初始化节点类型,划分区域,选取节点类型,初始化任务池;课题正式运行时进行任务分配与调度,随着叶子计算节点完成任务后动态生成新任务并进行调度,当叶子计算节点完成某一任务计算且动态产生新的任务时,叶子节点选择第一个新任务继续进行计算,并通过消息回报其余新产生任务(如果存在)给区域主节点,全局主节点采用消息对各区域任务池进行探测,当某一区域任务显著高于其余区域时,对该区域任务进行回收,进入动态子任务任务池。本发明可避免课题运算过程中动态生成的任务导致负载不均衡的现象,提升计算资源的利用率和课题解算效率。
-
公开(公告)号:CN114218061A
公开(公告)日:2022-03-22
申请号:CN202110330612.7
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种测试记录自动登记方法,S1、测试结果确认模块通过查询测试课题目录下是否存在标志性的正确结束文件,确认测试结果是否正确;S2、错误阶段识别模块通过查询目录结构下每一个测试课题目录中的编译输出日志文件和运行输出日志文件,确定错误发生的阶段,是编译错、链接错还是运行错;S3、错误类型确定模块通过识别报错信息中的关键字信息确认具体错误类型;S4、信息筛选登记模块将具体的错误信息筛选出来并自动登记入库;S5、记录增补登记模块将无法自动写入的错误原因手工增补登记,使用提交入库命令即可将信息入库。本发明可有效解决测试记录手工整理带来的效率低下问题。
-
公开(公告)号:CN114217945A
公开(公告)日:2022-03-22
申请号:CN202110480245.9
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种缓冲受限的数据分块全交换通信实现方法,包括以下步骤:S1、申请用于全交换通信的缓冲空间,具体为:参与全交换通信的节点数为N,每个节点上全交换的数据量为A,起始地址为src,全交换通信块的大小为A/N,记为block;根据内存使用情况申请全交换通信块M倍的空间作为缓冲空间,缓冲空间的起始地址为buf;S2、每个节点向其他N‑1个节点各发送一个全交换通信块,并将接收到的来自其他N‑1个节点的N‑1个全交换通信块移动到全交换数据区,具体过程为每个节点执行下界为1、上界为N、跨步为M的循环。本发明能够在缓冲受限的情况下实现全交换通信,并在存储器容量一定的情况下增加全交换的数据量。
-
公开(公告)号:CN114217808A
公开(公告)日:2022-03-22
申请号:CN202110398337.2
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种编程语言指针类型Cache属性扩展方法,基于以下配置:扩展指针类型的Cache属性,Cache属性具有cached和uncached两个值,Cache属性初始化,允许在指针变量申明时为指针变量的Cache属性设置初始值;Cache属性设置,允许在程序语句中动态设置和修改指针变量的Cache属性值;Cache写暗示段子属性设置,指示对指定地址空间将马上进行写操作;Cache私有段子属性设置,作用域为其后的for、while、do‑while、if语句或{}括起来的复合语句,指示对指定地址空间的访问是私有的。本发明方便编程人员提高程序访存效率和降低Cache部件功耗。
-
-
-
-
-
-
-
-
-