-
公开(公告)号:CN114217939A
公开(公告)日:2022-03-22
申请号:CN202110381609.8
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所述专用控制核心组成与用户进程一一对应的异步控制核心;S3、实现单个进程控制核心与多个运算核心阵列的逻辑组合;S6、当位于进程控制核心的用户程序进程(主线程)进行与位于专用控制核心的通信探查服务关键互斥操作时,对线程信号量置1,以主动抢锁并进行关键互斥操作,抢锁成功后信号量置0,允许通信探查服务继续竞争线程锁。本发明可有效提升通信密集型大规模并发应用的整体性能。
-
公开(公告)号:CN114217916A
公开(公告)日:2022-03-22
申请号:CN202110453158.4
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种DNN算子库动态数据分块方法,包括以下步骤:S1、用户调用所需算子,并传入一组由多个整数组成的参数,作为S2的输入;S2、根据S1中获取的参数大小和算法的参数适用范围,将一组参数划分为多组参数,并为各组参数选择不同的算法进行处理;S3、从S2获得参数,根据算法特点,为参数中各个维度[N,H,W,C]的数据设置优先级;S4、在保证内存充裕的前提下,将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序,依次增加其分块的大小;S5、将动态选择好的数据分块传递给对应的算法,调用算法,得出结果。本发明保证了算子性能的最佳发挥,不需要用户担忧众多算法如何抉择的问题,具有良好的用户体验。
-
公开(公告)号:CN112559197A
公开(公告)日:2021-03-26
申请号:CN201910852525.0
申请日:2019-09-10
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块,第(i,j)号内核将第(j,i)块数据从内存读取到自己的片上存储器内,数据块C(i,j)的卷积计算需要数据块A(i,k)和数据块B(k,j),其中k=1,2,……,N;S2、进入循环k,循环次数从1到N,共N次,利用得到的数据块A、数据块B完成数据块C的第K次卷积计算。本发明显著降低卷积计算在异构众核处理器上的内存访存需求,充分发挥众核计算能力,从而实现卷积计算高性能,提升其在异构众核处理器上的计算性能。
-
公开(公告)号:CN112448898A
公开(公告)日:2021-03-05
申请号:CN201910799268.9
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: H04L12/863
Abstract: 本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发送序列号进行比对;S3、成功处理按序到达的消息请求后,将接收端的消息序列号生成器的值加1,并对乱序到达队列内的元素查找是否有匹配当前接收序列号的元素;S4、如果认定为一次异步消息的乱序到达,将该次接收完成的消息缓冲区加入乱序到达队列,待后续消息到达并更新接收序列号后进行处理。本发明既可以有效保证通信通路的并发,也可以有效解决底层互连架构带来的消息序问题,同时序列号生成及匹配对于性能的影响非常小。
-
公开(公告)号:CN107273094B
公开(公告)日:2020-06-16
申请号:CN201710353362.2
申请日:2017-05-18
Applicant: 中国科学院软件研究所 , 无锡江南计算技术研究所
Abstract: 本发明公开了一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法,基于“神威·太湖之光”上的申威众核处理器体系结构特征和HPCG算法优化的需要,使用了改进ELL格式的数据结构对原始数据结构进行替换,除了包含矩阵数据本身的数据结构,还支持分块着色,索引转换,进程通信,以及向量位置映射等相关的数据结构,并且中间处理过程采用了申威众核平台提供的Athread多线程库进行并行,最终应用于HPCG算法的核心函数SpMV和SymGS优化过程中,相应的性能和带宽百分比取得了一致性的加速比,最高分别为18.2和17.6。
-
公开(公告)号:CN109101349A
公开(公告)日:2018-12-28
申请号:CN201810928724.0
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54
Abstract: 本发明公开一种动静结合的多策略通信支撑方法,包括:将全局进程组按照设定的分块大小划分全连接区;初始化过程中,在全连接区内每个进程均建立和其他进程间的通信通路,全连接区之间按照对应进程关系建立通信通路,建立虚拟连接时静态分配发送队列和接收队列资源;初始化结束后,程序执行过程中,当出现跨区域无连接进程间通信时,采用动态转发或本地计算方式传递请求并交换队列信息,建立通信通路。本发明采用静态分区和动态转发相结合的通信通路管理策略,在提升通信支撑环境可扩展性的同时,避免了连接管理线程对用户进程产生的不良影响;分层次的集合通信实现可以有效支撑复杂的集合通信需求,提升了集合通信的可扩展性。
-
公开(公告)号:CN107273094A
公开(公告)日:2017-10-20
申请号:CN201710353362.2
申请日:2017-05-18
Applicant: 中国科学院软件研究所 , 无锡江南计算技术研究所
Abstract: 本发明公开了一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法,基于“神威·太湖之光”上的申威众核处理器体系结构特征和HPCG算法优化的需要,使用了改进ELL格式的数据结构对原始数据结构进行替换,除了包含矩阵数据本身的数据结构,还支持分块着色,索引转换,进程通信,以及向量位置映射等相关的数据结构,并且中间处理过程采用了申威众核平台提供的Athread多线程库进行并行,最终应用于HPCG算法的核心函数SpMV和SymGS优化过程中,相应的性能和带宽百分比取得了一致性的加速比,最高分别为18.2和17.6。
-
公开(公告)号:CN105528253A
公开(公告)日:2016-04-27
申请号:CN201510831794.0
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: G06F9/54
CPC classification number: G06F9/546
Abstract: 本发明提供了一种异构众核系统上的流水式通信并行方法,包括:分析并行应用的数据,把逻辑上有关联的数据划分为一块;确定一块数据上的相关性顺序。在该块数据上的相关性顺序是先通信后计算的情况下,每个处理器上的进程首先由控制核心启动对该块数据的通信处理,计算核心等待控制核心对该块数据的通信完成;计算核心收到控制核心针对该块数据通信完成的标志后开始该块数据的计算,同时控制核心开始下一块数据的通信;按照这个步骤的处理以此类推,直到所有的数据块都完成计算和通信。
-
-
-
-
-
-
-