-
公开(公告)号:CN112631968A
公开(公告)日:2021-04-09
申请号:CN202011524240.3
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。
-
公开(公告)号:CN112631548B
公开(公告)日:2022-10-04
申请号:CN202011524239.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F7/523
Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。
-
公开(公告)号:CN112631968B
公开(公告)日:2022-10-04
申请号:CN202011524240.3
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。
-
公开(公告)号:CN112632461A
公开(公告)日:2021-04-09
申请号:CN202011524214.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/16
Abstract: 本发明公开一种定制阵列计算结构上复杂线性代数运算的实现方法,包括以下步骤:步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为nb;步骤2:将输入矩阵分解为多个小规模矩阵和剩余矩阵;步骤3:在定制阵列计算结构上完成小规模矩阵的线性代数运算;步骤4:在定制阵列计算结构上完成矩阵乘运算;步骤5:根据小规模矩阵上线性代数运算的计算结果和矩阵乘运算的计算结果更新剩余矩阵;步骤6:若剩余矩阵的规模大于等于nb,则将剩余矩阵作为输入矩阵,返回步骤1执行,否则运算完成。本发明可实现基本线性代数子程序库中所定义的level‑3运算或复杂线性代数运算在定制计算结构上的高性能、高效执行。
-
公开(公告)号:CN112632459A
公开(公告)日:2021-04-09
申请号:CN202011525795.X
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。
-
公开(公告)号:CN112632459B
公开(公告)日:2023-07-07
申请号:CN202011525795.X
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F17/15 , G06N3/0464 , G06F17/16
Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。
-
公开(公告)号:CN112631548A
公开(公告)日:2021-04-09
申请号:CN202011524239.0
申请日:2020-12-22
Applicant: 无锡江南计算技术研究所
IPC: G06F7/523
Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。
-
-
-
-
-
-