面向卷积神经网络的DSP紧缩字乘法方法及系统

    公开(公告)号:CN113568597A

    公开(公告)日:2021-10-29

    申请号:CN202110802058.8

    申请日:2021-07-15

    Abstract: 本发明提供了一种面向卷积神经网络的DSP紧缩字乘法方法及系统,设计出一种基于FPGA上DSP资源实现的紧缩字乘法计算模式。紧缩字乘法即利用数据量化的低比特优势,在一个DSP内部实现多个四比特乘法,提高资源的利用效率。此外,由于FPGA对DSP单元之间的级联进行了专门优化,因此本发明又利用DSP单元的级联实现了紧缩字乘累加,即完成多次紧缩字乘法并累加后,再从紧缩字乘积中提取出运算结果。本发明充分利用了DSP的特性,提高了DSP的利用效率,有利于系统能效比的优化。

    一种基于张量融合的数据流优化方法、装置、设备及介质

    公开(公告)号:CN118427501A

    公开(公告)日:2024-08-02

    申请号:CN202410661141.1

    申请日:2024-05-27

    Abstract: 本发明公开了一种基于张量融合的数据流优化方法、装置、设备及介质,包括:获取神经网络编译器中算子节点,并确认算子节点间的矛盾数据流;遍历第一算子和第二算子的矛盾维度,并重新调度矛盾维度对矛盾数据流进行融合;根据当前张量融合的情况对所述第一算子和所述第二算子的切片形状进行重新划分,对重新划分后的切片大小进行调整,使得重新划分后的切片能够将绑定张量对应的中间切片容纳在芯片的缓存区中以消除矛盾,从而使得一对操作符中的任何数据流均能够融合;通过上述方式进行多算子融合过程中,通过解耦优化步骤能够将数据流探索从单算子内部拓展到算子间,得到最优的数据流,克服传统数据流由于需要大量访存的访存瓶颈问题。

    面向卷积神经网络的DSP紧缩字乘法方法及系统

    公开(公告)号:CN113568597B

    公开(公告)日:2024-07-26

    申请号:CN202110802058.8

    申请日:2021-07-15

    Abstract: 本发明提供了一种面向卷积神经网络的DSP紧缩字乘法方法及系统,设计出一种基于FPGA上DSP资源实现的紧缩字乘法计算模式。紧缩字乘法即利用数据量化的低比特优势,在一个DSP内部实现多个四比特乘法,提高资源的利用效率。此外,由于FPGA对DSP单元之间的级联进行了专门优化,因此本发明又利用DSP单元的级联实现了紧缩字乘累加,即完成多次紧缩字乘法并累加后,再从紧缩字乘积中提取出运算结果。本发明充分利用了DSP的特性,提高了DSP的利用效率,有利于系统能效比的优化。

    基于通道融合的可配置稀疏卷积硬件加速方法和系统

    公开(公告)号:CN115115044A

    公开(公告)日:2022-09-27

    申请号:CN202210789002.8

    申请日:2022-07-06

    Abstract: 本发明提供了一种基于通道融合的可配置稀疏卷积硬件加速方法和系统,包括:步骤1:获取所有非零的有效激活值数据与对应卷积核权重数据的偏移地址;步骤2:将有效激活值数据与对应卷积核权重数据的偏移地址进行存储,并将对应的有效值数据对依次进行乘累加操作;步骤3:在乘累加队列中设置数据选择器与数据分路器,将融合卷积核的数据结果重新解耦合至对应的输出通道进行累加;步骤4:对不同通道的数据进行重分配,将融合后的对应输出通道的数据重新送入融合前的输出通道的位置。本发明通过对稀疏卷积核进行通道融合预处理,使得各个融合后的输出通道间有效数据量尽可能平衡,从而带来了更高的硬件利用率与更高的稀疏卷积加速效率。

    一种对抗阻变对称存储器硬失效错误的方法

    公开(公告)号:CN113450863A

    公开(公告)日:2021-09-28

    申请号:CN202110776874.6

    申请日:2021-07-09

    Abstract: 本发明公开了一种对抗阻变对称存储器硬失效错误的方法,涉及基于新型材料的非易失存储器领域,其基于两种与数据存储方向无关的粒度,即最小的失效数据块粒度和RC块粒度,包括混合粒度重映射、失效字平移优化、重映射信息记录优化。混合粒度重映射和失效字平移优化数据恢复时的读次数被限制在最多两次,而借助重映射信息记录优化,存储空间的利用率被极大地提升。本发明可提高阻变对称存储器的使用寿命,增强存储器可靠性。

    基于通道融合的可配置稀疏卷积硬件加速方法和系统

    公开(公告)号:CN115115044B

    公开(公告)日:2025-04-11

    申请号:CN202210789002.8

    申请日:2022-07-06

    Abstract: 本发明提供了一种基于通道融合的可配置稀疏卷积硬件加速方法和系统,包括:步骤1:获取所有非零的有效激活值数据与对应卷积核权重数据的偏移地址;步骤2:将有效激活值数据与对应卷积核权重数据的偏移地址进行存储,并将对应的有效值数据对依次进行乘累加操作;步骤3:在乘累加队列中设置数据选择器与数据分路器,将融合卷积核的数据结果重新解耦合至对应的输出通道进行累加;步骤4:对不同通道的数据进行重分配,将融合后的对应输出通道的数据重新送入融合前的输出通道的位置。本发明通过对稀疏卷积核进行通道融合预处理,使得各个融合后的输出通道间有效数据量尽可能平衡,从而带来了更高的硬件利用率与更高的稀疏卷积加速效率。

    一种对抗阻变对称存储器硬失效错误的方法

    公开(公告)号:CN113450863B

    公开(公告)日:2024-09-10

    申请号:CN202110776874.6

    申请日:2021-07-09

    Abstract: 本发明公开了一种对抗阻变对称存储器硬失效错误的方法,涉及基于新型材料的非易失存储器领域,其基于两种与数据存储方向无关的粒度,即最小的失效数据块粒度和RC块粒度,包括混合粒度重映射、失效字平移优化、重映射信息记录优化。混合粒度重映射和失效字平移优化数据恢复时的读次数被限制在最多两次,而借助重映射信息记录优化,存储空间的利用率被极大地提升。本发明可提高阻变对称存储器的使用寿命,增强存储器可靠性。

    基于可信执行环境的密文搜索系统与方法

    公开(公告)号:CN113449293A

    公开(公告)日:2021-09-28

    申请号:CN202110793367.3

    申请日:2021-07-14

    Abstract: 本发明提供一种基于可信执行环境的密文搜索系统与方法,其中系统包括客户端、服务端和芯片远程认证中心,服务端包括不可信区和可信区,不可信区包括API接口、静态链接、数据库和第一存储模块;可信区包括认证密钥协商模块、索引创建搜索模块和第二存储模块;服务端通过API接口与客户端通信连接;静态链接连接认证密钥协商模块和索引创建搜索模块,索引创建搜索模块连接第二存储模块;认证密钥协商模块与芯片远程认证中心通信连接。本发明的一种基于可信执行环境的密文搜索系统与方法,提供了更加丰富的搜索功能与更高的搜索效率,做到了兼顾安全性、功能完整性以及执行效率,解决了用户在云存储与云计算所面临的隐私保护问题。

Patent Agency Ranking