-
公开(公告)号:CN114253705A
公开(公告)日:2022-03-29
申请号:CN202110381442.5
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种处理器性能筛选方法,包括以下步骤:将待筛选的处理器划分为n个子集;判断性能筛选是否完成;将处理器Pij的性能记为Aij;将子集i内所有处理器的性能值收集到根节点r,作为待分类的样本;选取分类数k,设置分类终止条件为k_thres;对于每个样本Aij,计算其到每个初始质心的欧式距离;S8、对于每个类别t,重新计算属于该类别的样本S[t]的平均值;对于每个类别t,将经过本轮筛选后剩余的处理器作为待筛选处理器,累加筛选总时间或筛选轮次,回到S1。本发明灵活性强、鲁棒性好,显著减少人为干预、利于筛片自动化,降低筛片人员工作负担和误操作可能,有助于提高筛片效率和效果。
-
公开(公告)号:CN114217939A
公开(公告)日:2022-03-22
申请号:CN202110381609.8
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所述专用控制核心组成与用户进程一一对应的异步控制核心;S3、实现单个进程控制核心与多个运算核心阵列的逻辑组合;S6、当位于进程控制核心的用户程序进程(主线程)进行与位于专用控制核心的通信探查服务关键互斥操作时,对线程信号量置1,以主动抢锁并进行关键互斥操作,抢锁成功后信号量置0,允许通信探查服务继续竞争线程锁。本发明可有效提升通信密集型大规模并发应用的整体性能。
-
公开(公告)号:CN114217916A
公开(公告)日:2022-03-22
申请号:CN202110453158.4
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种DNN算子库动态数据分块方法,包括以下步骤:S1、用户调用所需算子,并传入一组由多个整数组成的参数,作为S2的输入;S2、根据S1中获取的参数大小和算法的参数适用范围,将一组参数划分为多组参数,并为各组参数选择不同的算法进行处理;S3、从S2获得参数,根据算法特点,为参数中各个维度[N,H,W,C]的数据设置优先级;S4、在保证内存充裕的前提下,将[N,H,W,C]按照参数中各个数据的优先级从高到低的顺序,依次增加其分块的大小;S5、将动态选择好的数据分块传递给对应的算法,调用算法,得出结果。本发明保证了算子性能的最佳发挥,不需要用户担忧众多算法如何抉择的问题,具有良好的用户体验。
-
公开(公告)号:CN114217915B
公开(公告)日:2025-01-10
申请号:CN202110398335.3
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核上基于主‑从模型的轻量级多线程处理方法,设置四种线程状态,分别为初始化、等待任务、任务完成和线程退出;在共享内存上开辟长整形数组;在共享内存上开辟数组,用于线程组内主线程向从属线程传递参数;根据主线程及其从属线程核组号,设置每个线程组的掩码cgmask,掩码有CG_NUM位;使用共享模式运行并行程序,每个核组为一个进程;当需要退出线程状态时,主线程调用Master_leave接口;执行完毕后,各核组恢复进程状态,可以根据进程号继续执行任务。本发明为用户提供了方便使用、更加灵活、开销更低的片内多线程解决方案。
-
公开(公告)号:CN114217940A
公开(公告)日:2022-03-22
申请号:CN202110381658.1
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于任务循环划分策略的负载平衡方法,包括以下步骤:S1、根据任务实际需求和线程的任务处理能力,将任务池中的每个任务划分为线程们可高效并行处理的若干子任务;S2、对S1中得到若干子任务编号,将任务池中的任务编号为taskid,每个任务划分后子任务编号为jobid,则每个子任务有唯一编号,记线程个数为n;S3、依次处理每个任务,根据S2中编号,将编号为(taskid,jobid)的子任务分配给第(jobid%n+taskid)%n个线程。本发明可以在异构众核处理器上多线程并行处理任务时,从整体上均衡各线程的任务负载,提升计算效率与系统稳定性。
-
公开(公告)号:CN114221871A
公开(公告)日:2022-03-22
申请号:CN202110381666.6
申请日:2021-04-09
Applicant: 无锡江南计算技术研究所
IPC: H04L41/12 , H04L67/1095 , H04L12/18
Abstract: 本发明公开一种网格化流水的全收集方法,包括以下步骤:S1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;S2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结构映射到大规模集群互联网络结构;S3、在所述二级网格化通信结构上,先在各组内完成数据的收集和共享,再开启全局流水。本发明能够合理利用资源,实现全收集集合通信中的通信聚合和顶层网络的带宽节省,有效提高了全收集集合通信的性能,对通信密集型应用具有积极影响。
-
公开(公告)号:CN114218523A
公开(公告)日:2022-03-22
申请号:CN202110483033.6
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上的矩阵转置方法,针对大规模矩阵M*N,其中,M%8=0,N%8=0;包括以下步骤:S1、将大规模矩阵M*N以8×8粒度分块;S2、从核阵列共64个从核,利用混洗指令对该分块转置;转置运算前开始读入第k+64个分块进从核LDM,即该从核要处理的下一轮分块;S2.2、如果S2.1中读取的第p轮分块为原矩阵第i行第j列分块,则将其转置后的分块矩阵存储于新矩阵的第j行第i列分块;S2.3、当从核处理完毕第p轮分块;S3、当从核阵列处理完所有分块后,得到原矩阵的转置矩阵。本发明可以充分利用加速指令中的混洗指令进行向量化加速,突破了传统的矩阵转置算法,充分发挥硬件潜力。
-
公开(公告)号:CN114218150A
公开(公告)日:2022-03-22
申请号:CN202110481454.5
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F15/167 , G06F9/50 , G06F13/28
Abstract: 本发明公开一种异构众核架构上CPU共享数组引导维选取策略,对矩阵引导维进行如下调整,并存储于CPU共享空间中:S1、申请CPU共享空间时,控制申请空间的首地址即src 128B对界,使得从核DMA取时源地址始终128B对界;S2选取ld=64*(6a+1),a为满足64*(6a+1)>=N的最小整数值;S3、如果S2中取得的ld%31==0,取a=a+1,使得体冲突问题得到规避;S4、M×N双精度矩阵,行主序,以S3中取得的ld作为引导维,以src为首地址,存储在CPU共享空间中。本发明平衡从核DMA取数据时各个存控上的访存量,实现负载均衡,且规避存控体冲突。
-
公开(公告)号:CN114218147A
公开(公告)日:2022-03-22
申请号:CN202110480202.0
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F15/163
Abstract: 本发明公开一种计算核心加速的通信优化方法,包括以下步骤:S1、控制核心通过检查运算核心的状态参数,感知运算核心是否处于空闲状态;S2、若运算核心处于空闲状态,则利用运算核心的聚合访存能力加速通信中的数据传输或者利用运算核心的计算能力加速通信中的数据计算,实现通信优化;若运算核心不空闲,则利用控制核心正常通信;S3、通信完毕,优化结束。本发明将通信协议的部分步骤卸载至运算核心阵列,利用运算核心来提升通信性能,实现通信支撑服务与异构体系结构的深度融合,以达到加速通信过程的目的。
-
公开(公告)号:CN114217943A
公开(公告)日:2022-03-22
申请号:CN202110398330.0
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种通信支撑环境的初始化方法,包括以下步骤:S1、调用作业管理接口,解析本道作业的资源总数tasksize、各进程在作业中的初始资源序号Sid、资源名列表nodeidlist、资源片内唯一标识mpeidlist、pid列表pidlist、网络设备标识列表guidlist,并按资源列表自然序排列;S2、根据各进程的初始资源序号Sid计算Sid%cg_per_process,从作业系统返回信息中提取满足模cg_per_process为0的进程的相关信息。本发明有助于支撑用户求解更大的问题规模、追求更高的性能,且实现简便,不影响消息性能,用户调用消息接口时无额外开销。
-
-
-
-
-
-
-
-
-