一种动态可演化智能处理芯片结构

    公开(公告)号:CN112631968A

    公开(公告)日:2021-04-09

    申请号:CN202011524240.3

    申请日:2020-12-22

    Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。

    深度卷积的在线计算部件

    公开(公告)号:CN112632459B

    公开(公告)日:2023-07-07

    申请号:CN202011525795.X

    申请日:2020-12-22

    Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。

    一种神经网络硬件加速器的数据在线压缩方法及装置

    公开(公告)号:CN115660056A

    公开(公告)日:2023-01-31

    申请号:CN202211363442.3

    申请日:2022-11-02

    Abstract: 本申请公开了一种神经网络硬件加速器的数据在线压缩方法及装置,方法包括对神经网络输出的第一激活值进行转换处理,得到第一激活掩码;将第一激活掩码划分为至少两组激活子掩码,并按照预设顺序依次对每组激活子掩码进行累加处理,得到激活位置掩码;基于第一激活掩码、激活位置掩码以及神经网络输出的权重值,计算出激活选择掩码;根据激活选择掩码对第一激活值进行筛选处理,得到目标激活值,并基于目标激活值生成第二激活掩码。通过对激活值进行在线掩码的设置以及对权重值的离线压缩,不仅对不同的神经网络压缩的适应性强,还可提高数据移动效率,在降低功耗的同时保证了吞吐量。

    基于混合粒度乘法部件的多精度乘法器及运算方法

    公开(公告)号:CN112631548A

    公开(公告)日:2021-04-09

    申请号:CN202011524239.0

    申请日:2020-12-22

    Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。

    基于混合粒度乘法部件的多精度乘法器及运算方法

    公开(公告)号:CN112631548B

    公开(公告)日:2022-10-04

    申请号:CN202011524239.0

    申请日:2020-12-22

    Abstract: 本发明公开一种基于混合粒度乘法部件的多精度乘法器及运算方法,所述运算方法包括以下步骤:调度器将乘法运算的两个位宽分别为Mbit、Nbit的操作数进行分割;调度器计算步骤1中获得的每一组细粒度乘法运算结果需要向左移动的位数;调度器将步骤1中分割后的细粒度乘法运算的两个操作数和步骤2中对应的左移位数打包成乘法器指令;调度器将步骤3中生成的乘法器指令送入计算单元的指令队列;细粒度乘法部件完成细粒度的乘法运算;将乘法结果向左移位后的结果送入加法树。本发明很好的平衡了计算延迟、计算能力的利用率和控制结构复杂度三者之间的关系,降低了控制结构的复杂度。

    一种面向合成孔径雷达图像的目标检测方法及装置

    公开(公告)号:CN115641282A

    公开(公告)日:2023-01-24

    申请号:CN202211363441.9

    申请日:2022-11-02

    Abstract: 本申请公开了一种面向合成孔径雷达图像的目标检测方法及装置,方法包括确定至少两种卷积操作,并基于至少两种卷积操作构建第一神经网络;将样本合成孔径雷达图像输入至第一神经网络,并根据预测结果以及样本真实结果,计算出第一损失值;基于第一损失值进行训练,并根据第一神经网络中的架构参数以及预设派生规则,派生出第二神经网络;将待处理合成孔径雷达图像输入至第二神经网络,并根据预测结果在待处理合成孔径雷达图像上显示目标检测框。相比于人工设计目标检测的神经网络模型,通过神经架构搜索自动化完成更符合需求的网络设计,不仅有效避免过多的专家人工知识所带来的领域知识限制,还可极大提高目标的检测效率以及精度。

    一种动态可演化智能处理芯片结构

    公开(公告)号:CN112631968B

    公开(公告)日:2022-10-04

    申请号:CN202011524240.3

    申请日:2020-12-22

    Abstract: 本发明公开一种动态可演化智能处理芯片结构,包括:通用处理器、智能处理单元、内存控制器和内存接口、可编程逻辑区域、可编程逻辑控制器,所述可编程逻辑区域进一步包括:动态系统总线、动态IO控制器和动态智能计算单元;动态系统总线:可以根据需求,对其拓扑结构、接口数量和规格、仲裁机制等进行重构,动态IO控制器:用于根据系统对于IO需求的不同,重构为一个或者多个不同类型的IO控制器,动态智能计算单元:用于根据需要重构为特定的硬件结构,实现对计算、访存、IO的定制加速。本发明可实现对整个系统中计算、访存、IO等方面的性能和效率优化,提高智能应用的计算效率,实现智能应用的全栈定制加速。

    深度卷积的在线计算部件

    公开(公告)号:CN112632459A

    公开(公告)日:2021-04-09

    申请号:CN202011525795.X

    申请日:2020-12-22

    Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。

    一种图像检测模型的高效全整数量化方法

    公开(公告)号:CN112508125A

    公开(公告)日:2021-03-16

    申请号:CN202011529800.4

    申请日:2020-12-22

    Abstract: 本发明公开一种目标检测模型的高效全整数量化方法,所述图像检测模型中各层卷积的权值、偏置、输入特征图和输出特征图均采用整数表示,量化推理过程均采用整数计算,具体包括以下步骤:对实数版本的图像检测模型进行正常训练、量化感知训练、量化参数生成、应用生成的各层参数,在计算设备上进行基于全整数运算的推理。本发明可以大大减少图像检测模型的推理时间,减少模型在磁盘存储和内存占用方面的空间,同时保持图像检测模型的高检测精度,有助于在FPGA等计算设备上实现更加高效的图像目标检测系统。

Patent Agency Ranking