-
公开(公告)号:CN114218521A
公开(公告)日:2022-03-22
申请号:CN202110452546.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出output的形状,得到Ho*Wo;S2、根据output的形状,在Ho、Wo维度上,根据每个核的逻辑编号,将卷积计算任务平均分配给众核;S3、每个核根据自己任务大小;S4、每个核通过得到的input(Hi_BLOCK*Wo_BLOCK)和weight,进行卷积计算;S5、重复S3和S4,直到计算完毕。本发明节约了内存带宽资源,同时能够充分运用众核的计算资源。
-
公开(公告)号:CN112532539A
公开(公告)日:2021-03-19
申请号:CN201910879920.8
申请日:2019-09-18
Applicant: 无锡江南计算技术研究所
IPC: H04L12/867
Abstract: 本发明公开一种面向大规模并发通信的优化方法,包括以下步骤:S1、发送方向接收方发起发送请求,设置完成计数器初值;S2、接收方收到来自于发送方的发送请求后,匹配相关接收请求信息,向发送方应答目的地址信息;S3、发送方收到来自于接收方的请求应答后,投递拆分后的前n个传输请求;S4、如果探查到某一个传输请求完成,则将完成计数器的值减1,并判断当前完成计数器的值是否为0,如果为0,向发送方投递完成通知,否则,继续补充后续传输请求;S5、接收方收到来自于接收方的完成通知,置接收操作完成。本发明解决了网络资源竞争导致的性能干扰问题和并发通信的性能可扩展性问题,可有效增强并发通信优化手段的灵活性,提升大规模并发通信性能。
-
公开(公告)号:CN102945164A
公开(公告)日:2013-02-27
申请号:CN201210418659.X
申请日:2012-10-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供了一种数据处理方法,适用于计算机系统模拟器,所述方法包括:在模拟第一程序的过程中根据第二程序的特征符号识别出所述第二程序的起始位置,所述第一程序包含所述第二程序;当识别到所述第二程序的起始位置后转入执行模拟器中与所述第二程序具有同样功能的功能块,所述功能块的返回位置为所述第二程序的返回位置。所述方法能够在保证模拟的有效性和准确性的前提下,提高模拟器的数据处理和数据传输速度。
-
公开(公告)号:CN114218147A
公开(公告)日:2022-03-22
申请号:CN202110480202.0
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F15/163
Abstract: 本发明公开一种计算核心加速的通信优化方法,包括以下步骤:S1、控制核心通过检查运算核心的状态参数,感知运算核心是否处于空闲状态;S2、若运算核心处于空闲状态,则利用运算核心的聚合访存能力加速通信中的数据传输或者利用运算核心的计算能力加速通信中的数据计算,实现通信优化;若运算核心不空闲,则利用控制核心正常通信;S3、通信完毕,优化结束。本发明将通信协议的部分步骤卸载至运算核心阵列,利用运算核心来提升通信性能,实现通信支撑服务与异构体系结构的深度融合,以达到加速通信过程的目的。
-
公开(公告)号:CN102446113B
公开(公告)日:2014-02-26
申请号:CN201010508866.5
申请日:2010-10-12
Applicant: 无锡江南计算技术研究所
IPC: G06F9/455
Abstract: 一种底层消息接口模拟方法,包括:模拟执行目标机的操作系统;监测所述目标机的操作系统代码中的进程切换,并于监测到所述进程切换后触发注释机制,生成底层消息子过程索引表;对目标机指令流中的每一条指令进行识别处理,并于识别出底层消息子过程调用时执行该消息接口的模拟处理,获取消息参数虚地址;将所述消息参数虚地址转换为消息参数物理地址;调用所述底层消息子过程索引表执行消息功能模拟,根据所述消息参数物理地址实现消息的传递。基于上述方法,还提供了一种底层消息接口模拟装置。本发明能够基于全结构并行计算机状态支持多节点消息功能的模拟,简化了模拟方式,提高并行应用程序的模拟效率。
-
公开(公告)号:CN102446113A
公开(公告)日:2012-05-09
申请号:CN201010508866.5
申请日:2010-10-12
Applicant: 无锡江南计算技术研究所
IPC: G06F9/455
Abstract: 一种底层消息接口模拟方法,包括:模拟执行目标机的操作系统;监测所述目标机的操作系统代码中的进程切换,并于监测到所述进程切换后触发注释机制,生成底层消息子过程索引表;对目标机指令流中的每一条指令进行识别处理,并于识别出底层消息子过程调用时执行该消息接口的模拟处理,获取消息参数虚地址;将所述消息参数虚地址转换为消息参数物理地址;调用所述底层消息子过程索引表执行消息功能模拟,根据所述消息参数物理地址实现消息的传递。基于上述方法,还提供了一种底层消息接口模拟装置。本发明能够基于全结构并行计算机状态支持多节点消息功能的模拟,简化了模拟方式,提高并行应用程序的模拟效率。
-
公开(公告)号:CN114253705A
公开(公告)日:2022-03-29
申请号:CN202110381442.5
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种处理器性能筛选方法,包括以下步骤:将待筛选的处理器划分为n个子集;判断性能筛选是否完成;将处理器Pij的性能记为Aij;将子集i内所有处理器的性能值收集到根节点r,作为待分类的样本;选取分类数k,设置分类终止条件为k_thres;对于每个样本Aij,计算其到每个初始质心的欧式距离;S8、对于每个类别t,重新计算属于该类别的样本S[t]的平均值;对于每个类别t,将经过本轮筛选后剩余的处理器作为待筛选处理器,累加筛选总时间或筛选轮次,回到S1。本发明灵活性强、鲁棒性好,显著减少人为干预、利于筛片自动化,降低筛片人员工作负担和误操作可能,有助于提高筛片效率和效果。
-
公开(公告)号:CN114217939A
公开(公告)日:2022-03-22
申请号:CN202110381609.8
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所述专用控制核心组成与用户进程一一对应的异步控制核心;S3、实现单个进程控制核心与多个运算核心阵列的逻辑组合;S6、当位于进程控制核心的用户程序进程(主线程)进行与位于专用控制核心的通信探查服务关键互斥操作时,对线程信号量置1,以主动抢锁并进行关键互斥操作,抢锁成功后信号量置0,允许通信探查服务继续竞争线程锁。本发明可有效提升通信密集型大规模并发应用的整体性能。
-
公开(公告)号:CN112559197A
公开(公告)日:2021-03-26
申请号:CN201910852525.0
申请日:2019-09-10
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块,第(i,j)号内核将第(j,i)块数据从内存读取到自己的片上存储器内,数据块C(i,j)的卷积计算需要数据块A(i,k)和数据块B(k,j),其中k=1,2,……,N;S2、进入循环k,循环次数从1到N,共N次,利用得到的数据块A、数据块B完成数据块C的第K次卷积计算。本发明显著降低卷积计算在异构众核处理器上的内存访存需求,充分发挥众核计算能力,从而实现卷积计算高性能,提升其在异构众核处理器上的计算性能。
-
公开(公告)号:CN112448898A
公开(公告)日:2021-03-05
申请号:CN201910799268.9
申请日:2019-08-28
Applicant: 无锡江南计算技术研究所
IPC: H04L12/863
Abstract: 本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发送序列号进行比对;S3、成功处理按序到达的消息请求后,将接收端的消息序列号生成器的值加1,并对乱序到达队列内的元素查找是否有匹配当前接收序列号的元素;S4、如果认定为一次异步消息的乱序到达,将该次接收完成的消息缓冲区加入乱序到达队列,待后续消息到达并更新接收序列号后进行处理。本发明既可以有效保证通信通路的并发,也可以有效解决底层互连架构带来的消息序问题,同时序列号生成及匹配对于性能的影响非常小。
-
-
-
-
-
-
-
-
-