-
公开(公告)号:CN106874898B
公开(公告)日:2021-03-30
申请号:CN201710226292.4
申请日:2017-04-08
Applicant: 复旦大学
Abstract: 本发明属于计算机视觉、人工智能技术领域,具体为一种基于深度卷积神经网络模型的大规模人脸识别方法。本发明首先提出面向大规模人脸识别的残差学习深度网络模型,该模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且模型中每一个卷积层之后都做批量归一化操作。本发明利用深度卷积神经网络学习能力强和残差学习收敛好的特性,在网络模型层数方面,把模型的层数增加;在残差层结构方面,本发明提出一个高效的残差层结构。在面向大规模人脸识别领域,本发明较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。
-
公开(公告)号:CN106250939A
公开(公告)日:2016-12-21
申请号:CN201610619786.4
申请日:2016-07-30
Applicant: 复旦大学
Abstract: 本发明属于数字图像处理、模式识别技术领域,具体为一种基于FPGA+ARM多层卷积神经网络的手写体字符识别方法。本发明实现的硬件平台是Xilinx ZYNQ-7030可编程片上SoC,硬件平台内置FPGA处理器和ARM Cortex A9。本发明首先在ARM端对输入的待识别手写体字符图像进行预处理,然后将结果图像传输到FPGA端,利用多层卷积神经网络提取图像特征,特征向量传输至ARM端完成手写体字符的识别。本发明充分利用了FPGA对大量简单重复计算的硬件并行处理能力和ARM的灵活可扩展优势,在保证算法模型性能的前提下,大幅降低了系统功耗。本发明的处理效率功耗比是主流服务器+GPU实现方案的10倍以上,有效解决了主流服务器+GPU方案功耗过大的问题。
-
公开(公告)号:CN106228240A
公开(公告)日:2016-12-14
申请号:CN201610615714.2
申请日:2016-07-30
Applicant: 复旦大学
Abstract: 本发明方法属于数字图像处理、模式识别技术领域。具体为一种基于FPGA的深度卷积神经网络实现方法。本发明实现的硬件平台是XilinxZYNQ-7030可编程片上SoC,硬件平台内置FPGA和ARM Cortex A9处理器。本发明首先将训练好的网络模型参数加载到FPGA端,然后在ARM端对输入数据进行预处理,再将结果传输到FPGA端,在FPGA端实现深度卷积神经网络的卷积计算和下采样,形成数据特征向量并传输至ARM端,完成特征分类计算。本发明利用FPGA的快速并行处理和极低功耗的高效能计算特性,实现深度卷积神经网络模型中复杂度最高的卷积计算部分,在保证算法正确率的前提下,大幅提升算法效率,降低功耗。
-
公开(公告)号:CN106228240B
公开(公告)日:2020-09-01
申请号:CN201610615714.2
申请日:2016-07-30
Applicant: 复旦大学
Abstract: 本发明方法属于数字图像处理、模式识别技术领域。具体为一种基于FPGA的深度卷积神经网络实现方法。本发明实现的硬件平台是XilinxZYNQ‑7030可编程片上SoC,硬件平台内置FPGA和ARM Cortex A9处理器。本发明首先将训练好的网络模型参数加载到FPGA端,然后在ARM端对输入数据进行预处理,再将结果传输到FPGA端,在FPGA端实现深度卷积神经网络的卷积计算和下采样,形成数据特征向量并传输至ARM端,完成特征分类计算。本发明利用FPGA的快速并行处理和极低功耗的高效能计算特性,实现深度卷积神经网络模型中复杂度最高的卷积计算部分,在保证算法正确率的前提下,大幅提升算法效率,降低功耗。
-
公开(公告)号:CN106250939B
公开(公告)日:2020-07-24
申请号:CN201610619786.4
申请日:2016-07-30
Applicant: 复旦大学
Abstract: 本发明属于数字图像处理、模式识别技术领域,具体为一种基于FPGA+ARM多层卷积神经网络的手写体字符识别方法。本发明实现的硬件平台是Xilinx ZYNQ‑7030可编程片上SoC,硬件平台内置FPGA处理器和ARM Cortex A9。本发明首先在ARM端对输入的待识别手写体字符图像进行预处理,然后将结果图像传输到FPGA端,利用多层卷积神经网络提取图像特征,特征向量传输至ARM端完成手写体字符的识别。本发明充分利用了FPGA对大量简单重复计算的硬件并行处理能力和ARM的灵活可扩展优势,在保证算法模型性能的前提下,大幅降低了系统功耗。本发明的处理效率功耗比是主流服务器+GPU实现方案的10倍以上,有效解决了主流服务器+GPU方案功耗过大的问题。
-
公开(公告)号:CN107563279A
公开(公告)日:2018-01-09
申请号:CN201710603212.2
申请日:2017-07-22
Applicant: 复旦大学
Abstract: 本发明属于计算机视觉图像处理技术领域,具体为针对人体属性分类的自适应权重调整的多任务模型训练方法。本发明提出一种新颖的多任务模型,通过引入了一个基于验证误差大小及变化趋势从而更新相应任务权重的算法,在训练过程中自适应动态地调整每个任务的相应权重值。具体步骤包括:(1)人脸以及行人图片的收集和属性类别的标注;(2)构建深度神经网络;(3)训练深度神经网络;(4)利用深度网络模型,进行人体属性预测;本发明方法具有速度快、精确度高、鲁棒性好等优点,非常适用于人体相关的检测、识别、分类等实际应用。
-
公开(公告)号:CN106874898A
公开(公告)日:2017-06-20
申请号:CN201710226292.4
申请日:2017-04-08
Applicant: 复旦大学
CPC classification number: G06K9/00281 , G06K9/00288 , G06N3/08 , G06N3/084
Abstract: 本发明属于计算机视觉、人工智能技术领域,具体为一种基于深度卷积神经网络模型的大规模人脸识别方法。本发明首先提出面向大规模人脸识别的残差学习深度网络模型,该模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且模型中每一个卷积层之后都做批量归一化操作。本发明利用深度卷积神经网络学习能力强和残差学习收敛好的特性,在网络模型层数方面,把模型的层数增加;在残差层结构方面,本发明提出一个高效的残差层结构。在面向大规模人脸识别领域,本发明较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。
-
公开(公告)号:CN108596143B
公开(公告)日:2021-07-27
申请号:CN201810435661.5
申请日:2018-05-03
Applicant: 复旦大学
Abstract: 为提供一种既能够完成大规模的人脸识别,又能够减小计算量从而降低硬件需求、减少训练所需时间的人脸识别方法及装置,本发明提供了一种基于残差量化卷积神经网络的人脸识别方法,包括如下步骤:步骤S1,构建卷积神经网络模型并进行训练;步骤S2,对目标图像进行预处理并对待判定图像进行预处理;步骤S3,将预处理待判定图像及预处理目标图像依次输入特征提取模型,得到待判定特征向量以及目标特征向量;步骤S4,根据目标特征向量以及待判定向量判定一致的人脸图像,其中,步骤S1包括将预定层设定为量化层并对量化层参数进行整数位量化来近似该量化层的参数矩阵的步骤。本发明还提供了基于残差量化卷积神经网络的人脸识别装置。
-
公开(公告)号:CN107563279B
公开(公告)日:2020-12-22
申请号:CN201710603212.2
申请日:2017-07-22
Applicant: 复旦大学
Abstract: 本发明属于计算机视觉图像处理技术领域,具体为针对人体属性分类的自适应权重调整的多任务模型训练方法。本发明提出一种新颖的多任务模型,通过引入了一个基于验证误差大小及变化趋势从而更新相应任务权重的算法,在训练过程中自适应动态地调整每个任务的相应权重值。具体步骤包括:(1)人脸以及行人图片的收集和属性类别的标注;(2)构建深度神经网络;(3)训练深度神经网络;(4)利用深度网络模型,进行人体属性预测;本发明方法具有速度快、精确度高、鲁棒性好等优点,非常适用于人体相关的检测、识别、分类等实际应用。
-
公开(公告)号:CN108596143A
公开(公告)日:2018-09-28
申请号:CN201810435661.5
申请日:2018-05-03
Applicant: 复旦大学
Abstract: 为提供一种既能够完成大规模的人脸识别,又能够减小计算量从而降低硬件需求、减少训练所需时间的人脸识别方法及装置,本发明提供了一种基于残差量化卷积神经网络的人脸识别方法,包括如下步骤:步骤S1,构建卷积神经网络模型并进行训练;步骤S2,对目标图像进行预处理并对待判定图像进行预处理;步骤S3,将预处理待判定图像及预处理目标图像依次输入特征提取模型,得到待判定特征向量以及目标特征向量;步骤S4,根据目标特征向量以及待判定向量判定一致的人脸图像,其中,步骤S1包括将预定层设定为量化层并对量化层参数进行整数位量化来近似该量化层的参数矩阵的步骤。本发明还提供了基于残差量化卷积神经网络的人脸识别装置。
-
-
-
-
-
-
-
-
-