一种快速查找数据集最大或最小N个值的硬件装置及方法

    公开(公告)号:CN113094020A

    公开(公告)日:2021-07-09

    申请号:CN202110278224.9

    申请日:2021-03-15

    Abstract: 本发明公开了一种快速查找数据集最大或最小N个值的硬件装置及方法,包括所述存储器单元,用于分组存储参与向量最大值或最小值运算的数据;所述寄存器单元,用于存储最大或最小N个值的中间结果和最终结果;所述比较器单元,用于比较当前最大值或最小值寄存器中所存储的值和当前每组对应的输入数据的大小关系;根据比较器的结果选择是否更新最大值或最小值寄存器中所存储的值。本发明通过使用两级多分组流水线设计,在不增加额外存储资源的情况下大大减少了求取最大或最小N个值的周期数,减少了计算所需的时间。

    一种面向硬件实现的GBDT分类模型压缩方法

    公开(公告)号:CN107797973A

    公开(公告)日:2018-03-13

    申请号:CN201710892740.4

    申请日:2017-09-27

    CPC classification number: G06F17/2252 G06N99/005

    Abstract: 一种面向硬件实现的GBDT分类模型压缩方法,该方法引入自定义剪枝、自定义编码以及自定义寻址来实现模型结构上、参数上及寻址上的压缩,以此来降低模型的存储空间。在提取构建模型的必须参数后,对其中的预测值value数据进行近似,并在此基础上对于模型中的每棵决策树进行剪枝;对剪枝后的模型进行自定义寻址,并将寻址信息记入相应节点的参数信息当中;同时,对于模型中的每一组节点信息进行二进制组合编码后按序存入其类别对应的数组即实现了对GBDT分类模型的压缩。利用位运算读取节点编码中存储的参数信息即可实现模型重建。对原始模型的剪枝、模型参数的编码以及模型寻址过程的改变,使模型在硬件系统中的存储占用得到大幅降低。

    基于方同轴结构的近场耦合无源互调测试装置

    公开(公告)号:CN107302404A

    公开(公告)日:2017-10-27

    申请号:CN201710543067.3

    申请日:2017-07-05

    Abstract: 本发明公开了一种基于方同轴结构的近场耦合无源互调测试装置,本发明是在常规PIM测试方法的基础上,在测试系统中加入方同轴结构的近场耦合PIM测试装置,实现近场耦合PIM测试功能。包括不同形状的带开缝的方同轴结构,低PIM接头以及缝隙尺寸及分布的优化方法。本发明能够用来评估微波部件材料非线性和接触非线性的大小,为微波部件低PIM设计和工艺控制提供指导,为生产环节中PIM来源提供检测方法,提高产品良率。

    翅片式换热器
    4.
    发明公开

    公开(公告)号:CN101245974A

    公开(公告)日:2008-08-20

    申请号:CN200810017552.8

    申请日:2008-02-26

    Abstract: 本发明涉及换热器领域,特别涉及一种具有高效低阻的翅片式换热器,其包括由翅片组成的翅片排和垂直穿过所述翅片排的换热管,其特征在于,所述的换热管截面为椭圆形,所述的翅片上设置有纵向涡发生器。本发明能够在大幅度提高换热器的整体换热性能的同时仅小幅度的增加流动阻力,主要用于气-液换热或者气-相变换热。

    一种快速查找数据集最大或最小N个值的硬件装置及方法

    公开(公告)号:CN113094020B

    公开(公告)日:2023-03-28

    申请号:CN202110278224.9

    申请日:2021-03-15

    Abstract: 本发明公开了一种快速查找数据集最大或最小N个值的硬件装置及方法,包括所述存储器单元,用于分组存储参与向量最大值或最小值运算的数据;所述寄存器单元,用于存储最大或最小N个值的中间结果和最终结果;所述比较器单元,用于比较当前最大值或最小值寄存器中所存储的值和当前每组对应的输入数据的大小关系;根据比较器的结果选择是否更新最大值或最小值寄存器中所存储的值。本发明通过使用两级多分组流水线设计,在不增加额外存储资源的情况下大大减少了求取最大或最小N个值的周期数,减少了计算所需的时间。

    一种硬件加速器的可重构阵列优化方法及自动调优方法

    公开(公告)号:CN113220630A

    公开(公告)日:2021-08-06

    申请号:CN202110548117.3

    申请日:2021-05-19

    Abstract: 本发明公开了一种硬件加速器的可重构阵列优化方法及自动调优方法,属于神经网络张量加速器设计工程技术领域。所述优化方法包括适用于被动改变的硬件参数作为外层参数,适用于主动改变的硬件参数作为内层参数;外层参数为输入通道、输出通道和整数位宽;内层参数为逻辑核、模式掩码和单元掩码。所述自动调优方法包括以:针对外层参数,通过应用级切换中设置对应寄存器位置,完成各个应用的最佳硬件配置;针对内层参数,采用编译器+解释器的方式,通过设置逻辑核数和模式掩码完成零填充优化,通过设置单元掩码完成分组并行优化。本发明为对功耗和效率敏感的特殊领域系统中的深度神经网络模型部署提供一种高效的解决方案。

    一种硬件加速器多阵列并行计算方法及系统

    公开(公告)号:CN114970849B

    公开(公告)日:2024-08-13

    申请号:CN202210744277.X

    申请日:2022-06-28

    Abstract: 本发明公开了一种硬件加速器多阵列并行计算方法及系统,对硬件加速器中的卷积运算进行分块处理;根据分块处理后的单层卷积,加载GEMM运算对应的输入数据、权重数据,根据加载的输入数据、权重数据以及数据在加速器缓存中的起始地址并行进行计算,通过多阵列的方式实现GEMM的高效运算,理想状态下能够节省GEMM运算接近至少一半的运算时间,提升基于卷积的神经网络在张量加速器上的推理效率,本发明多阵列的并行计算方式可减少权重数据的重复加载,缩小计算时间和访存时间的差距,提升卷积运算的效率,各计算模块可以并行计算,将不同模块的计算结果直接保存到根据基地址和偏移地址计算出的缓存地址中,保证了计算结果的正确性。

    一种硬件加速器的可重构阵列优化方法及自动调优方法

    公开(公告)号:CN113220630B

    公开(公告)日:2024-05-10

    申请号:CN202110548117.3

    申请日:2021-05-19

    Abstract: 本发明公开了一种硬件加速器的可重构阵列优化方法及自动调优方法,属于神经网络张量加速器设计工程技术领域。所述优化方法包括适用于被动改变的硬件参数作为外层参数,适用于主动改变的硬件参数作为内层参数;外层参数为输入通道、输出通道和整数位宽;内层参数为逻辑核、模式掩码和单元掩码。所述自动调优方法包括以:针对外层参数,通过应用级切换中设置对应寄存器位置,完成各个应用的最佳硬件配置;针对内层参数,采用编译器+解释器的方式,通过设置逻辑核数和模式掩码完成零填充优化,通过设置单元掩码完成分组并行优化。本发明为对功耗和效率敏感的特殊领域系统中的深度神经网络模型部署提供一种高效的解决方案。

    一种实现NMS计算和目标框坐标原尺寸下转换的方法和系统

    公开(公告)号:CN115100505A

    公开(公告)日:2022-09-23

    申请号:CN202210769541.5

    申请日:2022-07-01

    Abstract: 本发明公开了一种实现NMS计算和目标框坐标原尺寸下转换的方法和系统,通过将NMS中的计算过程拆分成置信度筛选出有效边框、有效边框的中心坐标转换左上角和右下角坐标、交并比计算的三个计算过程,在边框输入的时钟周期内,可流水完成NMS的计算,并有效减少了计算时间,提高了计算速度。筛选物体置信度高于置信度阈值的边框作为有效边框,只存储有效边框在寄存器组,利用读写指针控制寄存器组中有效边框依次进行交并比计算,大大减少了中间数据的存储;置信度筛选,有效信息整合和交并比计算的三级流水线,使计算效率大大增加,当最后一个边框携带信息输入完毕后,可使NMS的最终目标框同步输出,经原图尺寸转换后,得到可直接显示的最终有效边框信息。

    一种卷积神经网络量化推理优化方法及系统

    公开(公告)号:CN117391145A

    公开(公告)日:2024-01-12

    申请号:CN202311331237.3

    申请日:2023-10-13

    Abstract: 本发明公开了一种卷积神经网络量化推理优化方法及系统,对卷积神经网络模型的激活层进行定点化处理;再对卷积神经网络模型进行预训练,然后添加伪量化节点微调卷积神经网络模型;对量化系数scale进行松弛处理,存储各个数据的二次幂量化系数scale;利用scale对卷积神经网络模型进行量化,在卷积神经网络模型推理时,确定空闲位数用于保留负数数据的小数部分信息;利用保留的小数部分信息,连接卷积层时对数据进位传递给下一卷积层作为输入,连接add算子时,考虑小数部分信息实现不同量化系数scale下的量化后数据相加,完成适于片上定点化计算实现的卷积神经网络量化与推理优化。本发明在保证模型精度的前提下进而提升卷积神经网络的推理效率。

Patent Agency Ranking