基于环形结构的模块化三维片上网络无死锁路由系统和方法

    公开(公告)号:CN115277551B

    公开(公告)日:2024-01-12

    申请号:CN202210898679.5

    申请日:2022-07-28

    Abstract: 本发明提供了一种基于环形结构的模块化三维片上网络无死锁路由系统和方法,包括:三维片上网络的虚拟通道配置结构:顶层路由器各方向具有2条虚拟通道;有源中介层路由器X方向具有1条虚拟通道;Y方向使用环形结构,具有2条虚拟通道;中介层部分环形结构:在二维阵列的基础上,X方向保持不变且仅一条虚拟通道;Y方向增设首尾相接的额外通道构成环形结构,且每两个路由器之间具有两条虚拟通道;数据包传输选择模块:选择芯片内数据包、跨芯片数据包的传输方式。本发明能够有效避免死锁问题,同时在中介层Y方向节点较多的网络中具有较高的网络传输速率。

    一种嵌入式动态随机存储器增益单元及其操作方法

    公开(公告)号:CN111951848B

    公开(公告)日:2023-09-01

    申请号:CN202010832159.5

    申请日:2020-08-18

    Abstract: 本发明提供例了一种嵌入式动态随机存储器增益单元及其操作方法,增益单元包括写传输晶体管,第一读传输晶体管、第二读传输晶体管和写耦合晶体管,以及写字线、写位线、读字线、读位线、写耦合控制线;写传输晶体管的栅极连接写字线;第二读传输晶体管的栅极连接电荷存储节点,源极或漏极中的一极连接固定电位;写耦合晶体管的源极与漏极连接写耦合控制线,写耦合晶体管的栅极连接电荷存储节点。增益单元增大了存储节点的等效寄生电容;在写操作时,偏向性的增强关键数据的强度,而不破坏非关键数据的强度,在相同的电源电压下,写入的0和1具有更大的电压差;具有高数据保持时间及低刷新频率的特点。

    可重构的支持多精度浮点或定点运算的方法及系统

    公开(公告)号:CN116627379A

    公开(公告)日:2023-08-22

    申请号:CN202310585437.5

    申请日:2023-05-23

    Abstract: 本发明提供了一种可重构的支持多精度浮点或定点运算的方法及系统,能够完成多路并行的浮点或定点低精度运算,也可以整体实现一个高精度的浮点或定点运算。相比于现阶段已经提出的运算单元,本发明面向神经网络中的训练和推断、已经多种数据密集型应用的多精度、多规格的计算需求,在粗粒度可重构阵列的数据位宽首先得前提下,设计支持多精度及混合精度定/浮点操作的高能效、低延迟、低面积开销运算单元;统一浮点与定点数据通路,以更小的资源开销同时支持更多样化的计算模式,避免了在处理单元中独立放置浮点和定点计算引擎后,面向不同计算需求时资源浪费的问题,大幅提升可重构阵列的混合精度运算性能。

    一种多阵列粗粒度可重构架构的多层级并行性开发方法

    公开(公告)号:CN116048521A

    公开(公告)日:2023-05-02

    申请号:CN202310003557.X

    申请日:2023-01-03

    Abstract: 本发明公开了一种多阵列粗粒度可重构架构的多层级并行性开发方法,涉及粗粒度可重构架构编译器领域。输入的C++文件经过Polygeist处理成由MLIR中Affine方言和SCF方言组成的中间表达式;任务进行循环级的优化,并使用并行性分析和阵列间映射算法来开发高层次的任务级并行性和数据级并行性,并行信息通过CGRA方言形式进行存储,MLIR的方言会被翻译回带有并行信息的编辑后的C++文件;编辑后的C++文件经过Clang生成低级别的中间表达式,通过阵列内的映射算法开发循环级并行性和指令级并行性;在整合阵列间信息后,最终生成配置文件,完成整个流程。本发明降低映射复杂度,开发多层次的并行性,有效提升映射性能;扩展性强,可以与不同的阵列内映射方法进行组合和协同工作。

    一种基于数据流解耦的可重构阵列映射方法

    公开(公告)号:CN112612744B

    公开(公告)日:2022-11-25

    申请号:CN202011471974.X

    申请日:2020-12-14

    Abstract: 本发明公开了一种基于数据流解耦的可重构阵列映射方法,涉及可重构阵列的映射布局领域,首先,在原始DFG(Data Flow Graph,数据流图)中执行速率失配的区域间加入DE(Decouple Element,解耦单元),对数据流进行解耦;其次,利用一种“局部紧密,全局稀疏”的分簇式互连结构,将解耦后的所述数据流分隔在若干个规则的互连区域内;最后,通过一种分布式多阶段的布局算法,对每块所述互连区域内的所述数据流进行物理布局。本发明可以提高阵列的执行效率,完成了各种类型的单元的高效映射,并提升布局的速度和质量。

    基于通道融合的可配置稀疏卷积硬件加速方法和系统

    公开(公告)号:CN115115044A

    公开(公告)日:2022-09-27

    申请号:CN202210789002.8

    申请日:2022-07-06

    Abstract: 本发明提供了一种基于通道融合的可配置稀疏卷积硬件加速方法和系统,包括:步骤1:获取所有非零的有效激活值数据与对应卷积核权重数据的偏移地址;步骤2:将有效激活值数据与对应卷积核权重数据的偏移地址进行存储,并将对应的有效值数据对依次进行乘累加操作;步骤3:在乘累加队列中设置数据选择器与数据分路器,将融合卷积核的数据结果重新解耦合至对应的输出通道进行累加;步骤4:对不同通道的数据进行重分配,将融合后的对应输出通道的数据重新送入融合前的输出通道的位置。本发明通过对稀疏卷积核进行通道融合预处理,使得各个融合后的输出通道间有效数据量尽可能平衡,从而带来了更高的硬件利用率与更高的稀疏卷积加速效率。

    基于自适应分配的神经网络加速器实现系统和方法

    公开(公告)号:CN115081608A

    公开(公告)日:2022-09-20

    申请号:CN202210750313.3

    申请日:2022-06-29

    Abstract: 本发明提供了一种基于自适应分配的神经网络加速器实现系统和方法,包括:模块M1:构建激活与权重双数据位加速器的整体架构,包括DRAM与数据加载模块、写回模块、片上缓存模块、有效项生成单元和计算阵列,以及各模块间的连接关系;模块M2:构建激活数据和权重数据有效项表达方式,以及根据该表达方式构建激活数据和权重数据有效项生成单元和移位累加运算单元;模块M3:确定计算阵列中的数据流组织方式,进行数据分组和同步,构建权重数据组合位有效项表达方式。本发明在对激活数据和权重数据进行有效位检测后,通过权重数据组合位有效项的表示方法,减少双数据位串行计算时的有效项个数,缩短了计算周期。

    一种针对粗粒度可重构结构的降低多类访存冲突编译方法

    公开(公告)号:CN112306500B

    公开(公告)日:2022-06-07

    申请号:CN202011375400.2

    申请日:2020-11-30

    Abstract: 一种针对粗粒度可重构结构的降低多类访存冲突编译方法,在编译器后端面高度时,采用访存压力分摊方法进行处理,调整不同子DFG的启动时间,调度结果将会通过数组起始地址偏置分配方法处理,对一时间内所有的访存操作访问的不同数组起始地址进行调整,还包括冲突感知映射方法的处理,根据冲突矩阵和当前映射情况将不同操作映射至PE上,重排序和回溯算法确保了映射过程的正确性。本发明的有益效果为:有效降低多数组间的多存储体冲突,大幅度降低主存利用DMA传递数据至片上存储器的时间代价;避免访存冲突,带来CGRA上更高的应用加速比;编译器后端流程结构简单,算法复杂度低,编译速度快。

    面向大规模MIMO信号检测的粗粒度可重构架构系统

    公开(公告)号:CN113055060B

    公开(公告)日:2022-04-05

    申请号:CN202110249669.4

    申请日:2021-03-08

    Abstract: 本发明提供了一种面向大规模MIMO信号检测的粗粒度可重构架构系统,包括:计算阵列模块,包括多个计算基本单元,其中每一个计算基本单元均包括一个计算单元及其配置单元a;访存阵列模块,包括多个访存基本单元,其中每一个访存基本单元均包括一个访存单元及其配置单元b;互连网络模块,包括多个路由基本单元,其中每一个路由基本单元均包括一个路由单元及其配置单元c;访存单元设置于计算阵列模块的外围;不同计算单元之间以及计算单元与访存单元均通过路由单元进行数据传输;不同路由单元之间相互连接。本发明针对面积效率进行优化,提高架构的面积效率。

Patent Agency Ranking