-
公开(公告)号:CN112632459B
公开(公告)日:2023-07-07
申请号:CN202011525795.X
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/15 , G06N3/0464 , G06F17/16
Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。
-
公开(公告)号:CN115660056A
公开(公告)日:2023-01-31
申请号:CN202211363442.3
申请日:2022-11-02
Applicant: 无锡江南计算技术研究所
Abstract: 本申请公开了一种神经网络硬件加速器的数据在线压缩方法及装置,方法包括对神经网络输出的第一激活值进行转换处理,得到第一激活掩码;将第一激活掩码划分为至少两组激活子掩码,并按照预设顺序依次对每组激活子掩码进行累加处理,得到激活位置掩码;基于第一激活掩码、激活位置掩码以及神经网络输出的权重值,计算出激活选择掩码;根据激活选择掩码对第一激活值进行筛选处理,得到目标激活值,并基于目标激活值生成第二激活掩码。通过对激活值进行在线掩码的设置以及对权重值的离线压缩,不仅对不同的神经网络压缩的适应性强,还可提高数据移动效率,在降低功耗的同时保证了吞吐量。
-
公开(公告)号:CN112631548A
公开(公告)日:2021-04-09
申请号:CN202011524239.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F7/523
Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。
-
公开(公告)号:CN102932166B
公开(公告)日:2015-04-08
申请号:CN201210379888.5
申请日:2012-10-09
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供的一种集群电源管理系统包括:一个或多个计算节点组,其中每个计算节点组包括多个计算节点;与所述多个计算节点组分别对应的多个电源管理模块,其中对于每个计算节点组,在该计算节点组单独使用时,计算节点组中的作为主计算节点的一个计算节点通过控制信号对相应的电源管理模块进行配置,进而管理本计算节点组;主控节点,其通过电源管理模块的唯一地址选择电源管理模块以便对该电源管理模块进行配置;电源管理网络,用于处理电源管理模块与主控节点的通信。
-
公开(公告)号:CN102760176B
公开(公告)日:2015-02-11
申请号:CN201110110834.4
申请日:2011-04-29
Applicant: 无锡江南计算技术研究所
IPC: G06F17/50
Abstract: 本发明提供了一种硬件事务级仿真方法、引擎及系统,所述方法包括:加载目标系统模型,根据所述目标系统模型创建至少一个仿真线程;依次执行所述仿真线程,将执行仿真线程产生的仿真事件加入事件队列,所述仿真事件记录待触发的仿真线程的线程号;调取所述事件队列中的仿真事件,调度并执行调取的仿真事件记录的待触发的仿真线程的线程号指向的仿真线程,将执行仿真线程产生的仿真事件加入所述事件队列。本发明基于事件驱动的仿真机制,加快了仿真速度,同时提供了精简的仿真建模接口能更方便地描述具有普遍并发性的硬件系统。
-
公开(公告)号:CN102868761B
公开(公告)日:2014-10-22
申请号:CN201210374987.4
申请日:2012-09-28
Applicant: 无锡江南计算技术研究所
Abstract: 本发明提供了一种基于空间坐标的集群网络自动配置及管理方法。将各个节点组卡的控制接口以硬连线方式进行连接,以形成集群网络;通过采用固定编码格式的位置信息编码进行层次的网络地址配置,其中位置信息编码长度是由集群网络中的节点的系统规模及层次配置决定的。将位置信息编码分成低位数据段、中位数据段以及高位数据段;并且,利用高位数据段来指定网络地址配置方式及有效位标志;在高位数据段为特定值的情况下判断当前编码有效并使用位置信息编码进行节点网络地址配置,否则表示采用节点文件系统的网络地址配置文件进行节点网络地址配置。
-
公开(公告)号:CN103076849A
公开(公告)日:2013-05-01
申请号:CN201210580256.5
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Inventor: 谢向辉 , 吴东 , 钱磊 , 原昊 , 张昆 , 臧春峰 , 郝子宇 , 张鲁飞 , 李玺 , 严忻凯 , 邬贵明 , 方兴 , 叶楠 , 胡苏太 , 韦海亮 , 周浩杰 , 陶志荣
Abstract: 一种可重构微服务器系统,包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线,从而微处理器通过系统总线与内存和输入输出外设进行数据交换;而且,可重构加速部件连接至微处理器和/或系统总线,从而与微处理器和/或连接在系统总线上的内存和输入输出外设进行数据交换。此外,可重构加速部件可以连接独立的内存、输入输出外设和其它扩展接口。
-
公开(公告)号:CN103034295A
公开(公告)日:2013-04-10
申请号:CN201210575825.7
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Abstract: 一种输入输出能力增强的可重构微服务器,包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线;微处理器直接连接至可重构加速部件;可重构加速部件包括:可重构运算加速模块、多个可重构I/O增强单元、以及与可重构I/O增强单元中的每一个单独连接的多个I/O控制器;其中,多个可重构I/O增强单元连接至可重构运算加速模块和系统总线;而且其中,可重构I/O增强单元中的每一个的对应的多个I/O控制器连接至具有相同资源类型的I/O设备,由此可重构I/O增强单元中的每一个及其对应的多个I/O控制器用于控制与具有相同资源类型的I/O设备之间的数据交换。
-
公开(公告)号:CN103019324A
公开(公告)日:2013-04-03
申请号:CN201210575004.3
申请日:2012-12-26
Applicant: 无锡江南计算技术研究所
Abstract: 一种内存能力增强的可重构微服务器,包括:微处理器、系统总线、内存、可重构加速部件以及I/O外设;其中,微处理器、内存和I/O外设连接至系统总线,从而微处理器通过系统总线与内存和I/O外设进行数据交换;微处理器直接连接至可重构加速部件;并且,可重构加速部件连接至系统总线,从而通过系统总线与内存和I/O外设进行数据交换;可重构加速部件包括:可重构运算加速模块、总线接口转换模块、内部模块接口转换模块、内存访问模式扩展与增强模块、以及多个可重构内存控制器;可重构运算加速模块和总线接口转换模块直接连接至系统总线以进行数据交换。
-
公开(公告)号:CN102929812A
公开(公告)日:2013-02-13
申请号:CN201210371902.7
申请日:2012-09-28
Applicant: 无锡江南计算技术研究所
IPC: G06F13/16
Abstract: 本发明提供的一种基于存储接口的可重构加速器映射方法包括:初始步骤:用于将可重构加速器、通用处理器和存储体分别连接在存储总线上;第一步骤,用于通过可重构算法接口映射模块对可重构算法核心的硬件接口进行封装,其中所述可重构算法接口映射模块按照信号类型将可重构算法核心的硬件接口映射成为存储接口,由此按照对存储体的存储访问的读访问和写访问的方式对硬件接口进行读写;第二步骤,用于对通用处理器和存储控制器进行配置,以便通用处理器能够通过存储控制器访问可重构加速器;第三步骤,用于通过对通用处理器编程实现对可重构加速器中算法核心的软件映射。
-
-
-
-
-
-
-
-
-