-
公开(公告)号:CN114758191A
公开(公告)日:2022-07-15
申请号:CN202210395806.X
申请日:2022-04-15
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种图像识别方法、装置及一种电子设备和存储介质,该方法包括:利用训练图像和对应的类别标签对卷积神经网络的模型参数进行训练;卷积神经网络包括多个串联的堆叠基本单元,每个堆叠基本单元包括多个并联的分支,模型参数包括每个分支对应的加权参数和卷积层参数;对训练完成的卷积神经网络中的每个堆叠基本单元中的每个分支对应的加权参数和卷积层参数进行融合得到每个堆叠基本单元中的每个分支对应的融合参数;在训练完成的卷积神经网络的基础上基于每个堆叠基本单元中的每个分支对应的融合参数部署目标卷积神经网络;获取目标图像,将目标图像输入目标卷积神经网络中进行图像识别,提高了卷积神经网络进行图像识别的准确度。
-
公开(公告)号:CN114298291A
公开(公告)日:2022-04-08
申请号:CN202111591806.9
申请日:2021-12-23
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种模型量化处理系统,所述系统包括:BIAS参数存储器,用于存储神经网络模型的BIAS参数,并将BIAS参数传输至卷积计算模块;移位参数存储器,用于存储神经网络模型的移位参数,并将移位参数传输至卷积计算模块;零点参数存储器,用于存储神经网络模型的零点参数,并将零点参数传输至卷积计算模块;其中,BIAS参数存储器、移位参数存储器和零点参数存储器为BRAM类型的存储器;卷积计算模块,用于对量化参数进行量化计算并进行模型量化处理。本申请能够适应不同种类量化方法对应的量化参数的存储与更新,提高模型量化操作的效率。本申请还公开了一种模型量化处理方法,具有以上有益效果。
-
公开(公告)号:CN111091184A
公开(公告)日:2020-05-01
申请号:CN201911320012.1
申请日:2019-12-19
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种深度神经网络的量化方法、装置、电子设备及计算机可读存储介质,该方法包括:获取预训练生成的深度神经网络的浮点型模型;计算深度神经网络中各量化单元的重要性评估值;量化单元的类型包括深度神经网络的权重参数通道和/或隐含层,权重参数通道作为量化单元时用于进行权重参数量化,隐含层作为量化单元时用于进行激活输出量化;确定各个量化单元分别对应的量化位数;量化位数与各个量化单元的重要性评估值正向变化;根据量化位数对浮点型模型进行量化。本申请为不同权重参数通道和/或隐含层分别设置了与信息重要性相关变化的量化位数,在保障精度的同时进行了最大限度地量化压缩,减少了数据处理量并加快了计算。
-
公开(公告)号:CN114219080A
公开(公告)日:2022-03-22
申请号:CN202111682484.9
申请日:2021-12-31
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。
-
-
公开(公告)号:CN114219080B
公开(公告)日:2025-02-11
申请号:CN202111682484.9
申请日:2021-12-31
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06N3/0464 , G06N3/063
Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN111143272A
公开(公告)日:2020-05-12
申请号:CN201911385140.4
申请日:2019-12-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F15/173
Abstract: 本申请公开了一种异构计算平台的数据处理方法、装置及计算机可读存储介质。其中,方法包括预先在主机内存空间中开辟数据存储区域和数据处理结果存储区域,在FPGA加速板卡内存空间中开辟待处理数据存储区域和计算结果存储区域。主机将待计算数据存储在数据存储区域后,向FPGA加速板卡下发数据处理请求,FPGA加速板卡主动从数据存储区域读取待计算数据并存储至自己的待处理数据存储区域;然后调用相应数据处理算法对待处理数据存储区域中的待计算数据进行数据计算,得到数据计算结果并存储于自己的计算结果存储区域;最后主动将数据计算结果写回至主机的数据处理结果存储区域。本申请提高了异构计算平台的数据传递效率,提升FPGA加速板卡的计算性能。
-
-
公开(公告)号:CN112287986B
公开(公告)日:2023-07-18
申请号:CN202011110263.X
申请日:2020-10-16
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06V10/82 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/40 , G06N3/0495 , G06N3/082
Abstract: 本发明公开了一种图像处理方法、装置、设备及可读存储介质,该方法包括:获取目标图像;将目标图像输入至量化后的目标深度神经网络模型进行分类/检测,得到输出结果;按照与输出结果对应的策略,对目标图像进行处理;其中,量化得到目标深度神经网络模型的过程,包括:获取预训练得到的浮点型的深度神经网络模型;提取深度神经网络模型的权重特征;利用权重特征,确定出量化策略;按照量化策略,对深度神经网络模型进行量化,得到目标深度神经网络模型。在该方法中,量化得到目标深度神经网络模型的过程减少占用资源,缩短耗时,同时也能保障模型性能,从而使得图像分类/检测的性能得到保障,进一步可提高图像分类处理的性能。
-
公开(公告)号:CN114581952A
公开(公告)日:2022-06-03
申请号:CN202210242524.6
申请日:2022-03-11
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种行人重识别方法、系统、装置、设备及计算机可读存储介质,应用于异构计算设备,获取图像特征、量化参数、指令序列和滤波系数;图像特征包括待识别的目标行人图像的图像特征;按照指令序列对图像特征进行池化处理,得到池化处理结果;按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理,得到卷积处理结果;基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。本申请借助异构计算设备实现了行人重识别网络,可以提高计算效率,能效比及灵活性高,适用性好。本申请提供的一种行人重识别系统、装置、设备及计算机可读存储介质也解决了相应技术问题。
-
-
-
-
-
-
-
-
-