一种基于忆阻器阵列潜流路径的加法器快速计算方法

    公开(公告)号:CN109521993B

    公开(公告)日:2022-07-01

    申请号:CN201811299086.7

    申请日:2018-11-02

    Abstract: 本发明公开了一种基于忆阻器阵列潜流路径的加法器快速计算方法,包括如下步骤:1)进位潜流路径映射,预先计算RG,RD和RP的状态,确定不同位的进位计算途径;2)构造串行进位链,由于阵列结构无法形成进位传播路径,因此需要定制一条由RP控制的进位传播路径,以应对步骤1)中的RP;3)求和计算各比特位进位计算完成后,通过相应的逻辑实现并行完成所有位的求和计算。本发明基于忆阻器存储阵列的加法器设计,利用HSPICE,新型非易失存储器仿真工具NVSim对本设计进行测试,从计算性能,面积开销和功耗开销三方面都有显著提升。

    基于CTPN网络的异构加速系统及方法

    公开(公告)号:CN112732638B

    公开(公告)日:2022-05-06

    申请号:CN202110090277.8

    申请日:2021-01-22

    Abstract: 本发明提供了一种基于CTPN网络的异构加速系统及方法,包括CPU端和FPGA端;所述FPGA端包括第一子图和第二子图,所述CPU端包括第三子图;所述第一子图包括CTPN网络CNN部分,第二子图包括RNN部分,所述第三子图包括CTPN网络剩余部分;所述第一子图和第二子图在FPGA端执行,所述第三子图在CPU端执行;所述FPGA端的输出作为第三子图的输入;所述CPU端最终实现网络推断,并得到最终结果。本发明可以在精度下降很小的情况下,大幅度提高CTPN网络的推断速度,让加速器更好地实现实时场景文字识别的功能。

    一种自适应可变增益延时放大器

    公开(公告)号:CN111669137B

    公开(公告)日:2022-02-11

    申请号:CN202010345198.2

    申请日:2020-04-27

    Abstract: 本发明提供了一种自适应可变增益延时放大器,其包括:双路自适应脉冲收缩电路,用于接收两路脉冲信号,并在两路脉冲信号的延时大于阈值时对两路脉冲信号之间的延时进行收缩,使其延时适配于所述可变增益延时放大电路的输入可变范围;可变增益延时放大电路,基于RS锁存器的亚稳态效应对所述双路自适应脉冲收缩电路输出的双路脉冲信号的延时进行放大。本发明提供的延时放大器的实现和控制方式,具有结构简单、增益可控、稳定性强的优点;采用双路自适应脉冲收缩单元对输入进行预处理的方式,线性区间与动态增益的提升,且增益可控。

    基于TDC的分辨率可调时间测量统计系统及方法

    公开(公告)号:CN112486008B

    公开(公告)日:2021-12-07

    申请号:CN202011443031.6

    申请日:2020-12-11

    Abstract: 本发明提供了一种基于TDC的低资源消耗分辨率可调时间测量统计系统及方法,包括:TDC模块、采样模块、统计模块以及控制模块;所述TDC模块与采样模块相连;所述统计模块与采样模块相连;所述控制模块与TDC模块、采样模块、统计模块分别相连;所述控制模块能够完成TDC模块的初始化;所述控制模块能够对统计模块中分仓寄存单元和存储单元的读写时序进行控制。本发明的测量分辨率可调,单次测量能够完成数百个stop信号采样。另外,统计模块中采用的分仓统计和定时筛选存储方法降低了硬件资源消耗,适合应用中多路测量的需求。

    一种基于子图解耦的粗粒度可重构阵列调度方法

    公开(公告)号:CN112698954A

    公开(公告)日:2021-04-23

    申请号:CN202110049464.1

    申请日:2021-01-14

    Abstract: 本发明提供了一种基于子图解耦的粗粒度可重构阵列调度方法,涉及计算机协处理器加速器领域,包括子图解耦模块、动态配置切换模块、子图调度器,其中,所述子图解耦模块是针对程序中的非一致性控制流,将数据流图解耦成子图依次执行;所述动态配置切换模块是设计了一种多米诺骨牌式的配置切换机制,降低动态配置切换的开销;所述子图调度器是通过监测片上缓存中子缓存(bank)的空满状态,对子图的执行顺序进行动态调度。利用本发明提供的算法,可以提高阵列计算单元(PE)利用率,降低子图切换的开销。

    一种基于FPGA模拟的阻变神经网络加速器评估方法

    公开(公告)号:CN112613598A

    公开(公告)日:2021-04-06

    申请号:CN202011454516.5

    申请日:2020-12-10

    Abstract: 本发明公开了一种基于FPGA模拟的阻变神经网络加速器评估方法,涉及存算一体体系结构领域,包括存算一体通用指令集的编译、架构模型的建立、加速器的软硬件实现以及深度神经网络的性能评估。为加快仿真速度,本文通过分析现有阻变神经网络加速器的架构通用性,利用FPGA资源的高度并行性和运行时指令驱动的灵活模拟方式,通过对有限硬件资源的分时复用,支持主流阻变神经网络加速器架构和指令集的功能模拟,并针对主流网络给出详尽的性能评估。相比传统的硬件模拟器,本发明可以在不修改硬件结构的前提下支持更多神经网络的映射和性能评估;相比传统的软件模拟器,针对深度神经网络,本发明大大缩短了仿真时间。

    支持高吞吐多精度乘法运算的RISC-V通用处理器

    公开(公告)号:CN112506468A

    公开(公告)日:2021-03-16

    申请号:CN202011424890.0

    申请日:2020-12-09

    Abstract: 本发明提供了一种支持高吞吐多精度乘法运算的RISC‑V通用处理器,包括独立的乘法器数据通路,所述乘法器数据通路将多精度乘法器的数据通路与其他运算单元的数据通路分离,且多精度指令在执行阶段之后直接进入寄存器回写阶段而不用经过访存阶段,减少流水线寄存器的使用并节省面积和功耗,所述多精度乘法器具有独立的数据通路,进行将浮点乘法的结果写入矢量化寄存器文件VRF。本发明提供的一种支持高吞吐多精度乘法运算的RISC‑V通用处理器能高效地处理多精度计算需求。

    一种面向遥感图像目标检测的神经网络压缩方法

    公开(公告)号:CN112488070A

    公开(公告)日:2021-03-12

    申请号:CN202011517057.0

    申请日:2020-12-21

    Abstract: 一种面向遥感图像目标检测的神经网络压缩方法,包括基于深度学习框架对目标检测神经网络进行训练,得到基准网络模型和基准mAP指标;按照卷积层参数量大小顺序,逐层将传统卷积层拆分为一层深度卷积和一层逐点卷积两个参数量更小的卷积层,直至超过mAP指标损失阈值;进行基于TPE优化的自适应剪枝;对权重进行基于层的动态固定点量化,对输入特征图进行基于区域的动态固定点量化,进一步压缩网络模型,逐步降低量化位宽,直至mAP指标损失超过阈值。本发明能够自动对网络各层剪枝阈值进行调节,从而减少剪枝引起的性能损失;通过动态固定点量化,减少量化引起的性能损失;最终在遥感图像目标检测网络上达到25倍以上的压缩率,mAP指标损失不到1%。

Patent Agency Ranking