-
公开(公告)号:CN114236359A
公开(公告)日:2022-03-25
申请号:CN202111568525.1
申请日:2021-12-21
Applicant: 无锡江南计算技术研究所
IPC: G01R31/28 , G06F30/3308 , G06F30/327
Abstract: 本发明公开一种面向ATE测试设备的新型集成电路测试激励生成方法,包括以下步骤:步骤一、构建全片设计模型,步骤二、构建模拟验证环境,步骤三、编写测试文件,步骤四、按照四层结构、在不同验证平台、基于行为级进行仿真生成不同层次的测试激励,步骤五、融合形成完整测试激励,将在不同验证平台上生成的测试激励,在应用层框架的基础上,根据调用及层级关系,融合形成一个完整的测试激励。本发明可以降低测试激励生成环境构建的难度和复杂度,提高测试激励环境构建的兼容性和适应性,降低测试激励生成时间,提高测试激励生成效率,提高测试激励文件内信息的直观性和可读性。
-
公开(公告)号:CN114219065A
公开(公告)日:2022-03-22
申请号:CN202110349448.4
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种面向异构众核平台的Im2col加速方法,C*H*W的张量经过Im2col变换后的矩阵形状为(C*Kh*Kw)*(Ho*Wo),其中C是通道数,H和W分别为输入的高度和宽度,Kh和Kw为卷积核大小,Ho和Wo为输出张量的高度和宽度;根据C*Kh的大小选择不同的算法:当C*Kh大于等于64时,从变换后的矩阵出发,按照C*Kh进行任务划分;当C*Kh小于64时,从变换前的矩阵出发,按照C*H进行任务划分。本发明有效提高了Im2col变换的运算效率,作为卷积计算的前处理过程,有效保障了卷积算子和卷积神经网络的高效运行。
-
公开(公告)号:CN114218521A
公开(公告)日:2022-03-22
申请号:CN202110452546.0
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出output的形状,得到Ho*Wo;S2、根据output的形状,在Ho、Wo维度上,根据每个核的逻辑编号,将卷积计算任务平均分配给众核;S3、每个核根据自己任务大小;S4、每个核通过得到的input(Hi_BLOCK*Wo_BLOCK)和weight,进行卷积计算;S5、重复S3和S4,直到计算完毕。本发明节约了内存带宽资源,同时能够充分运用众核的计算资源。
-
公开(公告)号:CN114218146A
公开(公告)日:2022-03-22
申请号:CN202110452650.X
申请日:2021-04-26
Applicant: 无锡江南计算技术研究所
IPC: G06F15/163 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种针对大规模系统深度学习数据并行的分级通信优化方法,S1、根据所需计算节点总数,从若干个超节点中选择相同数量的计算节点,将计算节点按超节点进行分组;S2、每个计算节点计算出模型参数的梯度后,在分组内部进行MPI_Allreduce通信,计算出分组内的平均梯度;S3、各分组内的通信节点采用Ring_Allreduce算法进行梯度的Allreduce操作,计算出所有计算节点的平均梯度;S4、通信节点在分组内部进行Broadcast操作,完成所有计算节点的梯度更新。本发明在大规模分布式深度学习应用中的梯度更新过程中,减少了高延迟通信次数,充分利用了高速网络的通信性能,提高了通信效率。
-
公开(公告)号:CN114218061A
公开(公告)日:2022-03-22
申请号:CN202110330612.7
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开一种测试记录自动登记方法,S1、测试结果确认模块通过查询测试课题目录下是否存在标志性的正确结束文件,确认测试结果是否正确;S2、错误阶段识别模块通过查询目录结构下每一个测试课题目录中的编译输出日志文件和运行输出日志文件,确定错误发生的阶段,是编译错、链接错还是运行错;S3、错误类型确定模块通过识别报错信息中的关键字信息确认具体错误类型;S4、信息筛选登记模块将具体的错误信息筛选出来并自动登记入库;S5、记录增补登记模块将无法自动写入的错误原因手工增补登记,使用提交入库命令即可将信息入库。本发明可有效解决测试记录手工整理带来的效率低下问题。
-
公开(公告)号:CN114218022A
公开(公告)日:2022-03-22
申请号:CN202110398218.7
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种PCIE接口正确性测试方法,包括以下步骤:S1、A方在发送数据前,对发送缓冲区进行填充,填充消息描述符;S2、A方开始向B方发送数据;S3、B方等待接收数据;S4、A方等待接收B方发来的数据,在收到B方发送的数据后,进行数据正确性校验;S7、回到S1,直到遍历完成所有布数方式、操作类型、消息长度和消息偏移测试。本发明提高了PCIE接口正确性测试覆盖面和测试强度。
-
公开(公告)号:CN114217945A
公开(公告)日:2022-03-22
申请号:CN202110480245.9
申请日:2021-04-30
Applicant: 无锡江南计算技术研究所
IPC: G06F9/50
Abstract: 本发明公开一种缓冲受限的数据分块全交换通信实现方法,包括以下步骤:S1、申请用于全交换通信的缓冲空间,具体为:参与全交换通信的节点数为N,每个节点上全交换的数据量为A,起始地址为src,全交换通信块的大小为A/N,记为block;根据内存使用情况申请全交换通信块M倍的空间作为缓冲空间,缓冲空间的起始地址为buf;S2、每个节点向其他N‑1个节点各发送一个全交换通信块,并将接收到的来自其他N‑1个节点的N‑1个全交换通信块移动到全交换数据区,具体过程为每个节点执行下界为1、上界为N、跨步为M的循环。本发明能够在缓冲受限的情况下实现全交换通信,并在存储器容量一定的情况下增加全交换的数据量。
-
公开(公告)号:CN114217937A
公开(公告)日:2022-03-22
申请号:CN202110348948.6
申请日:2021-03-31
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种缓解假共享问题的编译器支持方法,包括以下步骤:S1、用户在程序中,对多线程Cache之间可能存在假共享的变量声明分别使用__attribute__((cacheline))接口;S2、编译器将声明树节点的基类tree_decl_common结构体中的标志位cacheline置为1,将align设置为Cache Line大小,并将tree_decl_common的基类tree_base结构体中的user_align置为1。本发明解决了某些Cache结构不保证横向一致性带来的假共享问题。
-
公开(公告)号:CN114217808A
公开(公告)日:2022-03-22
申请号:CN202110398337.2
申请日:2021-04-14
Applicant: 无锡江南计算技术研究所
IPC: G06F8/41
Abstract: 本发明公开一种编程语言指针类型Cache属性扩展方法,基于以下配置:扩展指针类型的Cache属性,Cache属性具有cached和uncached两个值,Cache属性初始化,允许在指针变量申明时为指针变量的Cache属性设置初始值;Cache属性设置,允许在程序语句中动态设置和修改指针变量的Cache属性值;Cache写暗示段子属性设置,指示对指定地址空间将马上进行写操作;Cache私有段子属性设置,作用域为其后的for、while、do‑while、if语句或{}括起来的复合语句,指示对指定地址空间的访问是私有的。本发明方便编程人员提高程序访存效率和降低Cache部件功耗。
-
公开(公告)号:CN114217770A
公开(公告)日:2022-03-22
申请号:CN202110325186.8
申请日:2021-03-26
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种基于异构众核架构的C++融合编程方法,包括以下步骤:S1、主核以头文件“athreadcxx.h”的形式提供athreadcxx类的对象;S2、athreadcxx类的对象通过构造函数进行从核资源的初始化,通过析构函数进行从核资源的回收;S3、编译器通过选项‑mhost将使用athreadcxx类的对象编程的主核程序进行编译;S4、从核以头文件“slavecxx.h”的形式提供线程私有全局变量PEN、COL和ROW,用于保存当前从核的编号和行列信息。本发明解决了不同架构的指令集混合链接符号多重定义问题、从核间的全局变量访存问题。
-
-
-
-
-
-
-
-
-