-
公开(公告)号:CN116704612B
公开(公告)日:2024-10-22
申请号:CN202310711768.9
申请日:2023-06-15
Applicant: 山东大学深圳研究院 , 山东大学 , 中国科学院自动化研究所 , 山东建筑大学 , 山东科技大学 , 银河水滴科技(北京)有限公司 , 泰华智慧产业集团股份有限公司
Abstract: 本发明涉及一种基于对抗域自适应学习的跨视角步态识别方法,包括:(1)构建整个基于对抗域自适应学习的网络并进行训练:步态轮廓预处理;步态视角级子域划分;构建嵌有层次特征聚合策略的特征提取器;构建视角变化对抗消除模块;构建度量学习模块;整个基于对抗域自适应学习的网络对抗训练;(2)跨视角步态识别:将待识别身份的步态轮廓序列送入训练好的嵌有层次特征聚合策略的特征提取器获取步态特征,与注册数据集进行特征相似性比对,完成待测样本的身份识别。本发明能够充分挖掘步态序列中时空信息的同时有效消除视角变化的干扰;本发明实现了对步态轮廓序列更为充分、综合的时空特征提取;有效增强了网络判别性步态特征提取的能力。
-
公开(公告)号:CN106934817B
公开(公告)日:2020-11-10
申请号:CN201710101482.3
申请日:2017-02-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种基于多属性的多目标跟踪方法及装置。所述方法,包括:通过目标跟踪方法确定当前跟踪目标是否处于复杂交叉状态,所述复杂交叉状态是指所述当前跟踪目标在预定数量的连续图像帧中与其他目标发生重叠;在所述当前跟踪目标处于复杂交叉状态时,依次使用当前跟踪目标的身高、衣着属性、步态属性三种信息进行再识别。本发明执行速度极快,同时也保证了准确率,特别是在有交叉发生时比一般方法出错少。
-
公开(公告)号:CN108737740A
公开(公告)日:2018-11-02
申请号:CN201810750879.X
申请日:2018-07-10
Applicant: 银河水滴科技(北京)有限公司 , 中国科学院自动化研究所
IPC: H04N5/235
Abstract: 本发明涉及一种图像补光方法及系统,获取在预设场景内采集到图像的图像信息;根据所述图像信息计算光照强度;判断所述光照强度是否处于光照阈值范围内;若所述光照强度未处于光照阈值范围内,则对所述预设场景进行补光。本发明提供的技术方案根据光照变化程度,自动调节补光灯功耗,因此补光强度可以调节可以以相对较低的功耗得到较好的补光效果,同时避免骤开/关的问题,延长补光灯寿命。
-
公开(公告)号:CN104834748B
公开(公告)日:2018-08-03
申请号:CN201510272498.1
申请日:2015-05-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
-
公开(公告)号:CN108304797A
公开(公告)日:2018-07-20
申请号:CN201810085316.3
申请日:2018-01-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉技术领域,具体提供了一种基于侧向抑制的视觉注意检测方法及装置,旨在解决如何提高计算机视觉注意机制的有效性和实用性。为此目的,本发明中的视觉注意检测方法包括下述步骤:获取目标图像的图像类别;获取每个激活函数神经元接收到的反馈信息;根据反馈信息判断是否关闭对应的激活函神经元;根据判断结果关闭相应的激活函数神经元后,对激活函数神经元的响应值进行归一化处理,得到选择性注意结果图;对选择性注意结果图进行归一化处理,得到显著性目标检测结果图。本发明的技术方案基于卷积神经网络,并能够利用卷积神经网络的前馈与反馈信息实现对目标物体的信息检测。同时,本发明中的装置能够执行并实现上述步骤。
-
公开(公告)号:CN106934817A
公开(公告)日:2017-07-07
申请号:CN201710101482.3
申请日:2017-02-23
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00718 , G06K9/00348 , G06K2209/21 , G06T2207/10016
Abstract: 本发明提出一种基于多属性的多目标跟踪方法及装置。所述方法,包括:通过目标跟踪方法确定当前跟踪目标是否处于复杂交叉状态,所述复杂交叉状态是指所述当前跟踪目标在预定数量的连续图像帧中与其他目标发生重叠;在所述当前跟踪目标处于复杂交叉状态时,依次使用当前跟踪目标的身高、衣着属性、步态属性三种信息进行再识别。本发明执行速度极快,同时也保证了准确率,特别是在有交叉发生时比一般方法出错少。
-
公开(公告)号:CN106778705A
公开(公告)日:2017-05-31
申请号:CN201710065013.0
申请日:2017-02-04
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。
-
公开(公告)号:CN105205453A
公开(公告)日:2015-12-30
申请号:CN201510537480.X
申请日:2015-08-28
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00597 , G06K9/0061 , G06K9/66
Abstract: 本发明公开了一种用于人眼检测和定位的方法,包括:对带有标定好的人眼矩形框位置的训练集中的所有图像,利用人眼矩形框位置生成二值化的标签图;在图像上随机取小图像块,无监督地分层训练多个自编码器以构建深度自编码器,并利用自编码器中各层的权重对深度自编码器进行初始化;在原图像和标签图的相同位置上随机取小原图像块和小标签图像块,以小标签图像块作为监督信息,以小原图像块为输入,优化深度自编码器;在待测图像上以滑动窗口的方式生成多个小待测图像块,利用深度自编码器得到每个小待测图像块的小待测标签图像块并将其合并在一起,得到待测图像的待测标签图,对待测标签图进行二值化,利用坐标投影或寻找轮廓得到人眼的位置。
-
公开(公告)号:CN102930295B
公开(公告)日:2015-11-11
申请号:CN201210409976.5
申请日:2012-10-24
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 一种基于自适应空间信息有向图的图像分类方法,包括步骤:从所有图像中提取局部特征;根据每个局部特征对应的视觉单词,从测试图像中随机抽取局部特征分组;利用聚类算法对各组局部特征的空间坐标聚类,以聚类中心为定点并连接各相邻顶点得到空间信息的有向图;根据局部特征的空间位置,对所有图像进行类聚操作,将聚集结果串联得到图像的最终表达。本发明能够自适应地考虑不同视觉单词在空间分布上的差异性,从而能够更好地对全局空间信息进行建模,因而,能够有效地提升图像分类精度。
-
公开(公告)号:CN104992167A
公开(公告)日:2015-10-21
申请号:CN201510451034.7
申请日:2015-07-28
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
CPC classification number: G06K9/00228
Abstract: 本发明公开了一种基于卷积神经网络的人脸检测方法及装置。所述方法包括将训练集中的所有图片缩放成预定大小的灰度图,并为每个所述图片中的每个像素点赋予标签信息,所述标签信息用于表示其对应的像素点是否为人脸;建立卷积神经网络,其中,所述卷积神经网络各层依次为输入层、多个卷积层、多个全连接层和输出层;使用梯度下降法和反向传播算法训练所述卷积神经网络;将待检测照片输入至训练好的所述卷积神经网络中,得到最后一层的输出特征值;将所述最后一层的输出特征值与预定阈值进行比较,以确定所述待测照片中各像素点是否为人脸区域;使用最小闭包的方法,根据确定为人脸区域的各像素点检测出人脸的位置。
-
-
-
-
-
-
-
-
-