-
公开(公告)号:CN105740903B
公开(公告)日:2019-01-25
申请号:CN201610066517.X
申请日:2016-01-29
Applicant: 北京大学
IPC: G06K9/62
Abstract: 本发明公开了一种多属性识别方法及装置,所述方法包括:对预设训练数据进行字典学习,得到包括字典矩阵和系数转化矩阵的属性识别模型;其中,预先训练数据为包含预设种类属性且标注好属性信息的训练数据;获取待识别样本的特征数据;利用所述字典矩阵对所述特征数据进行编码,得到编码系数;利用所述系数转化矩阵将所述编码系数转化为属性向量;利用所述属性向量对所述待识别样本进行多属性识别。本发明所述的多属性识别方法在训练过程中不需要对每个属性进行单独分类训练,且在识别过程中不需要对每个属性进行单独分类识别,而是通过一次识别得到所有的属性识别结果,因而本发明所述的方法在实际应用中会方便很多。
-
公开(公告)号:CN112487886A
公开(公告)日:2021-03-12
申请号:CN202011278529.1
申请日:2020-11-16
IPC: G06K9/00
Abstract: 本发明公开了一种有遮挡的人脸识别方法、装置、存储介质及终端,该方法包括:采集并预处理有遮挡的待识别人脸图像;提取预处理后的待识别人脸图像所对应的人脸全局特征;检测并提取预处理后的待识别人脸图像中未遮挡的人脸局部特征;将人脸全局特征和人脸局部特征拼接后,生成拼接后的人脸特征;从预设被遮挡人脸数据库中匹配拼接后的人脸特征对应的第二人脸特征;计算拼接后的人脸特征与第二人脸特征之间的相似度,并根据相似度判定待识别人脸图像和第二人脸特征的人脸图像是否为同一身份。因此,采用本申请实施例,可以提高复杂环境中被遮挡人脸识别的准确率。
-
公开(公告)号:CN113610737B
公开(公告)日:2023-10-24
申请号:CN202110838150.X
申请日:2021-07-23
Applicant: 北京大学
Abstract: 本申请涉及数据处理技术领域,更为具体来说,本申请涉及基于振幅与相位重组的数据增强方法、系统、设备及介质。所述方法包括:获取第一图像;对所述第一图像进行转换处理,得到转换处理图像;分别对所述第一图像和所述转换处理图像进行傅里叶变换得到所述第一图像和所述转换处理图像的相位信息与振幅信息;将所述第一图像的相位信息和所述转换处理图像的振幅信息基于反傅里叶变换得到第一增强图像;将所述转换处理图像的相位信息和所述第一图像的振幅信息基于反傅里叶变换得到第二增强图像。本方法能辅助针对图像的神经网络模型的训练,增强后的数据可以提高神经网络的泛化能力及鲁棒性,促进神经网络对雾、雨及各种噪音场景下的图像识别能力。
-
公开(公告)号:CN113610737A
公开(公告)日:2021-11-05
申请号:CN202110838150.X
申请日:2021-07-23
Applicant: 北京大学
Abstract: 本申请涉及数据处理技术领域,更为具体来说,本申请涉及基于振幅与相位重组的数据增强方法、系统、设备及介质。所述方法包括:获取第一图像;对所述第一图像进行转换处理,得到转换处理图像;分别对所述第一图像和所述转换处理图像进行傅里叶变换得到所述第一图像和所述转换处理图像的相位信息与振幅信息;将所述第一图像的相位信息和所述转换处理图像的振幅信息基于反傅里叶变换得到第一增强图像;将所述转换处理图像的相位信息和所述第一图像的振幅信息基于反傅里叶变换得到第二增强图像。本方法能辅助针对图像的神经网络模型的训练,增强后的数据可以提高神经网络的泛化能力及鲁棒性,促进神经网络对雾、雨及各种噪音场景下的图像识别能力。
-
公开(公告)号:CN113242271A
公开(公告)日:2021-08-10
申请号:CN202110286282.6
申请日:2021-03-17
Applicant: 北京大学
Abstract: 本申请能够提供一种基于数字视网膜的端、边、云协同系统及方法、设备,该协同系统可包括但不限于前端设备、边缘设备及云端设备。前端设备用于从采集的视频数据中提取出具有通用性的特征,并用于基于特征生成分析识别任务;前端设备还用于对分析识别任务进行处理,以得到用于发送至边缘设备的第一中间结果。边缘设备用于基于第一中间结果对分析识别任务进行处理,以得到用于发送至云端设备的第二中间结果。云端设备用于基于第二中间结果对分析识别任务进行处理,以生成视频数据的分析识别结果。基于本申请所提供的协同系统架构能够实现计算协同、特征协同以及模型协同,所以本申请技术方案具有高能效等优点,非常适用于处理大规模的视频数据。
-
公开(公告)号:CN113033616A
公开(公告)日:2021-06-25
申请号:CN202110230314.0
申请日:2021-03-02
Applicant: 北京大学
Abstract: 本发明公开了一种高质量视频重建方法、装置、设备及存储介质,所述方法包括提取参考视频流以及原始视频流的深度学习特征,得到参考特征流以及原始特征流;将所述参考特征流和原始特征流进行特征融合,得到融合特征流;根据所述融合特征流对待处理的低分辨率视频流进行视频重建,得到高质量的视频流。根据本公开实施例提供的高质量视频重建方法,可以对低分辨率的视频流进行视频重建,利用云端汇聚的低分辨率视频流以及深度学习特征,恢复出高质量的视频流。
-
公开(公告)号:CN112884120A
公开(公告)日:2021-06-01
申请号:CN202110130485.6
申请日:2021-01-29
Applicant: 北京大学
Abstract: 本申请提供了一种图神经网络表示架构,包括图结构数据表示模块用于各种图神经网络框架数据的相互转换的表示格式;基础表示模块用于各种图神经网络开源算法框架的图神经网络模型进行互相转换的基础表示格式;紧凑表示模块用于通过神经网络压缩算法以及加速算法将基础表示模块的图神经网络模型转化成序列化格式的紧凑表示格式;编码表示模块用于通过编码算法将紧凑表示模块的图神经网络模型转换为编码表示格式。从图神经网络到最终模型的不同表示层次的定义,能够统一图神经网络各个层次的表示,降低图神经网路模型与图神经网络开源框架的耦合关系,打破了各种图神经网路开源算法框架之间的壁垒,实现了不同图神经网络开源算法框架的互操作。
-
公开(公告)号:CN105740422B
公开(公告)日:2019-10-29
申请号:CN201610066163.9
申请日:2016-01-29
Applicant: 北京大学
IPC: G06F16/58
Abstract: 本发明公开了一种行人检索方法及装置,所述方法包括:对预设训练数据进行多任务字典学习,得到目标字典;所述预设训练数据包括当前场景下的行人图片数据和非当前场景下的行人图片数据;所述非当前场景下的行人图片数据为已标注好行人身份信息的数据;所述当前场景为待检索的行人图片所属的场景;对所述待检索的行人图片进行处理,获取所述待检索的行人图片的特征数据;利用所述目标字典对所述特征数据进行编码,得到目标编码系数;利用所述目标编码系数进行检索匹配,获取与所述待检索的行人图片匹配的图片。本发明在训练过程中不需要当前场景数据集的训练数据必须具有标注信息,因此使得发明在实际应用中更为方便。
-
公开(公告)号:CN103577829A
公开(公告)日:2014-02-12
申请号:CN201310552751.X
申请日:2013-11-08
Abstract: 本发明公开了一种车标定位方法和装置,属于计算机图像处理领域,该方法包括:根据先验知识确定车标所在的大致区域,并提取轮廓图;对轮廓图进行自适应分割,得到最优连通区分割;筛选出分割所得区域中为车标的区域,提取出车标图像。本发明实施例的方法和装置,采用自适应的连通区分割来定位车标,能提高车标定位的准确率。此外,通过定义车标似然度来进一步精定位车标,能更有效提高车标的定位准确率。
-
公开(公告)号:CN112862073A
公开(公告)日:2021-05-28
申请号:CN202110150563.9
申请日:2021-02-03
Applicant: 北京大学
Abstract: 本发明公开了一种压缩数据分析方法、装置、存储介质及终端,该方法包括:获取目标数据,并将所述目标数据进行压缩后生成压缩数据;将所述压缩数据输入预先训练的压缩数据分析模型中;其中,所述预先训练的压缩数据分析模型基于训练数据压缩后的压缩等级从选择性批归一化模块中选择不同的归一化模块和特征约束模块进行训练后生成;输出所述目标数据对应的分析结果。因此,采用本申请实施例,由于本申请利用神经网络结合选择性批归一化模块和特征约束模块来对压缩数据进行分析,从而提升了模型的分析性能,进一步提升了分析结果的准确度。
-
-
-
-
-
-
-
-
-