一种计算单核及混合网络可扩展加速器

    公开(公告)号:CN119272833A

    公开(公告)日:2025-01-07

    申请号:CN202411321309.0

    申请日:2024-09-23

    Abstract: 本发明提供计算单核及混合网络可扩展加速器,其选择模块根据网络模型层类别,确定计算单核的计算模式;数据访问模块根据确定的计算模式进行数据读取和传输,得到访问数据;稀疏索引模块根据确定的计算方式对访问数据进行稀疏处理;逻辑控制模块根据计算方式设计计算单元连接方式及数据路径;计算阵列根据计算单元连接方式以及数据路径,完成数据调度和计算执行。本发明的计算单核设计是兼容了CNN和Transformer计算模式的硬件加速架构,其稀疏索引模块同时支持卷积、全连接、注意力的不同稀疏方式,计算阵列适配卷积、全连接、注意力不同计算模式;以该计算单核为基础设计的混合网络可扩展加速器的利用率和计算速度得以有效提高。

    一种应用在数据流驱动的可重构阵列的混合精度运算单元

    公开(公告)号:CN114047903B

    公开(公告)日:2025-01-07

    申请号:CN202111320846.X

    申请日:2021-11-09

    Abstract: 本发明公开了一种应用在数据流驱动的可重构阵列的混合精度运算单元,涉及运算单元设计领域。本发明是一种支持混合精度,多种工作模式的运算单元,相比于现阶段已提出的运算单元,本发明面向通用计算密集型应用,设计了高能效的支持多规格、混合精度的定点运算单元,根据需求选择工作模式;基于本发明设计的低功耗、低开销的混合精度运算单元和合理的数据流调度方式,解决粗粒度可重构阵列固定规格计算单元面向神经网络应用的低精度运算模式时,计算单元资源利用率低和精度损失的问题,大幅提升可重构阵列面向神经网络应用的性能。

    一种对抗阻变对称存储器硬失效错误的方法

    公开(公告)号:CN113450863B

    公开(公告)日:2024-09-10

    申请号:CN202110776874.6

    申请日:2021-07-09

    Abstract: 本发明公开了一种对抗阻变对称存储器硬失效错误的方法,涉及基于新型材料的非易失存储器领域,其基于两种与数据存储方向无关的粒度,即最小的失效数据块粒度和RC块粒度,包括混合粒度重映射、失效字平移优化、重映射信息记录优化。混合粒度重映射和失效字平移优化数据恢复时的读次数被限制在最多两次,而借助重映射信息记录优化,存储空间的利用率被极大地提升。本发明可提高阻变对称存储器的使用寿命,增强存储器可靠性。

    面对面堆叠芯片结构的供电网络模型设计方法及系统

    公开(公告)号:CN118569167A

    公开(公告)日:2024-08-30

    申请号:CN202410680482.3

    申请日:2024-05-29

    Abstract: 本发明提供一种面对面堆叠芯片结构的供电网络模型设计方法及系统,包括:设计芯片的堆叠结构;根据芯片内的硅通孔TSV布局位置,将顶层逻辑芯片和底层存储芯片的供电结构进行划分;根据顶层金属层间距确定供电网络的划分粒度,将供电网络以供电基本单元模型为最小颗粒进行分解,同时剖析每类基本单元模型内部的组成结构;对各类供电基本单元模型以RLC网络的形式进行电路建模,对供电基本单元模型内部的无源组件进行寄生参数提取,抽取基本单元模型内的去耦电容容值及有源负载电流;将多个分布式供电基本单元模型进行级联,完成三维供电网络分布式模型设计。本发明能够快速精准地模拟处理器‑存储器堆叠芯片内部的供电网络结构。

    三维粗粒度可重构计算阵列芯片
    35.
    发明公开

    公开(公告)号:CN118568046A

    公开(公告)日:2024-08-30

    申请号:CN202410624500.6

    申请日:2024-05-20

    Abstract: 本发明提供了一种三维粗粒度可重构计算阵列芯片,芯片至少包含上层粗粒度可重构计算层芯片和多层存储层芯片,上层计算芯片包含用于启动系统的RISC‑V核、用于控制DDR中数据搬运的DDRMC、用于完成定点数据计算的定点计算阵列、用于完成浮点数据计算的浮点计算阵列;RISC‑V核包含多级总线系统,为计算阵列提供控制及片上存储支持,控制核及配置单元通过总线完成与计算阵列的交互;计算阵列包含若干计算单元和配置单元以保证计算的流水线执行;存储层芯片包含计算阵列相连接的SRAM存储阵列,上层芯片的计算模块和下层芯片的存储模块之间的访存通路通过一个包括DRAM、片上存储管理模块和访存单元的三级存储系统实现。

    一种面向粗粒度可重构阵列的可配置便笺式缓存设计方法

    公开(公告)号:CN114064560B

    公开(公告)日:2024-06-04

    申请号:CN202111361693.3

    申请日:2021-11-17

    Abstract: 本发明公开了一种面向粗粒度可重构阵列的可配置便笺式缓存设计方法,涉及可重构阵列的片上缓存领域,所述方法包括:按数据流和数据流组的方式组织所需要的数据,构建所述数据流和所述数据流组的参数配置;通过计数循环结束标志获取应用执行状态,设置所述数据流组状态切换指令和有限状态机,同步控制缓存中的所述数据流和数据执行相应操作。本发明可以解决Cache中存在的问题,具有易于使用、可预取、可编程的自动图像边界处理、可消除访存冲突、减少延迟等特征,利用可编程的访存模式,最大化片上数据复用,同时支持访存和计算的解耦合,提高阵列的计算效率。

    面向卷积神经网络的低功耗近似乘法器

    公开(公告)号:CN117973472A

    公开(公告)日:2024-05-03

    申请号:CN202410221588.7

    申请日:2024-02-28

    Abstract: 本发明提供了一种面向卷积神经网络的低功耗近似乘法器,包括:输入预处理电路、权重解码电路、基于部分积推测的近似乘法电路和输出后处理电路;输入预处理电路对乘法器的输入进行预处理,处理后的结果分别与基于部分积推测的近似乘法电路和输出后处理电路相连;权重解码电路对输入的权重进行解码,其解码结果分别与基于部分积推测的近似乘法电路和输出后处理电路相连;基于部分积推测的近似乘法电路对其输入实现近似乘法操作,其16位输出与输出后处理电路相连。本发明利用乘法器相邻部分积之间的相关性,使用较高权重的部分积推测较低权重部分积的总体数值,实现了近似部分积的生成和压缩过程,极大程度上减小了乘法器的功耗、面积和延时。

    基于蒸馏子图的图神经网络剪枝方法、设备和存储介质

    公开(公告)号:CN117933302A

    公开(公告)日:2024-04-26

    申请号:CN202410154892.4

    申请日:2024-02-02

    Abstract: 本发明涉及神经网络模型剪枝技术领域,尤其涉及基于蒸馏子图的图神经网络剪枝方法,包括以下步骤:S1:根据输入图中节点的邻接向量的相似性计算输入图中边的相似性生成稀疏化的蒸馏子图;S2:基于蒸馏子图对特征通道掩码和模型权重掩码进行剪枝,获得保留的节点特征向量和模型权重参数;S3:根据节点特征向量和模型权重参数进行重训练,得到最终模型权重值。本发明核心思想是先从原始的大尺寸输入图中,蒸馏提取一个保留了关键图结构信息的小尺寸稀疏子图,通过小尺寸的稀疏子图替代原始的大尺寸输入图进行剪枝,大幅减少剪枝过程中的计算与访存量,本发明通过提出节点特征和模型参数的协同剪枝技术,能够大幅降低节点特征和模型权重的参数量。

    一种基于数据稀疏性的超额行激活存算一体加速器设计方法

    公开(公告)号:CN113723044B

    公开(公告)日:2024-04-05

    申请号:CN202111061410.3

    申请日:2021-09-10

    Abstract: 本发明公开了一种基于数据稀疏性的超额行激活存算一体加速器设计方法,涉及存算一体架构的神经网络加速器设计领域,包括三部分,构建基于行激活数据的预测机制,建模外围电路器件限制与计算并行度,解决所述外围电路与所述计算并行度的匹配问题;构建行激活超额订阅机制,自适应地调整所述计算并行度和资源使用,解决稀疏数据下计算阵列和所述外围电路利用率低,资源冗余的问题;针对神经网络数据稀疏性的特点,重新规划控制流和数据流,解决了利用数据稀疏性而引入的复杂电路设计的问题。本发明通过预测输出数据规模,建模外围电路器件限制与计算并行度关系,根据预测自适应地调整计算并行度和资源使用,以最大程度利用外围电路资源。

    一种针对激活函数分段线性逼近的高精度通用算法

    公开(公告)号:CN117764137A

    公开(公告)日:2024-03-26

    申请号:CN202311659520.9

    申请日:2023-12-05

    Abstract: 本发明提出了一种针对激活函数分段线性逼近的高精度通用算法,解决了现有技术中其他分段线性逼近算法中存在的部分区间精度过剩的问题。一种针对激活函数分段线性逼近的高精度通用算法,包括如下步骤:步骤1:定义要逼近的激活函数f(x)、逼近的输入范围[ENDleft,ENDright]、逼近的区间数目seg_num;步骤2:在输入范围[ENDleft,ENDright]中使用二分法来递归寻找区间断点;步骤3:迭代优化相邻的断点,使各个区间内的误差相同。本发明提出了等误差分割算法,该算法通过平衡各分段之间的误差,解决了其他分段线性逼近算法中存在的部分区间精度过剩问题。除此之外,这种方法不仅提高了逼近精度,而且避免了引入额外的硬件开销,且具有通用性,适用于所有常见的激活函数。

Patent Agency Ranking