基于自适应空间信息有向图的图像分类方法

    公开(公告)号:CN102930295A

    公开(公告)日:2013-02-13

    申请号:CN201210409976.5

    申请日:2012-10-24

    Abstract: 一种基于自适应空间信息有向图的图像分类方法,包括步骤:从所有图像中提取局部特征;根据每个局部特征对应的视觉单词,从测试图像中随机抽取局部特征分组;利用聚类算法对各组局部特征的空间坐标聚类,以聚类中心为定点并连接各相邻顶点得到空间信息的有向图;根据局部特征的空间位置,对所有图像进行类聚操作,将聚集结果串联得到图像的最终表达。本发明能够自适应地考虑不同视觉单词在空间分布上的差异性,从而能够更好地对全局空间信息进行建模,因而,能够有效地提升图像分类精度。

    基于拓扑知觉组织理论的形状图像分类方法

    公开(公告)号:CN102511049A

    公开(公告)日:2012-06-20

    申请号:CN201080003725.6

    申请日:2010-05-13

    Abstract: 一种基于拓扑直觉组织理论的形状图像分类方法,包括步骤:提取形状图像的边缘点S1;构建拓扑空间,计算提取的边缘点在拓扑空间中的表达S2;根据边缘点在拓扑空间中的表达来提取全局特征S3;根据边缘点在欧氏空间中的表达来提取局部特征S4;融合全局特征和局部特征,根据全局特征的匹配程度来调节局部特征在融合过程中的权重S5;根据融合后的特征分类形状图像S6。本发明适用于智能视觉监控系统,帮助监控系统分类场景中的目标,使得监控系统能真正理解场景中正在发生什么,而且可以根据不同的目标类别采取不同的安全级别。适用于自动驾驶系统,判断交通标志的类别,从而让自动驾驶系统更佳智能化。

    一种行人个体分割方法及装置

    公开(公告)号:CN106778705B

    公开(公告)日:2020-03-17

    申请号:CN201710065013.0

    申请日:2017-02-04

    Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。

    一种利用相关主题模型识别社会群体行为的方法

    公开(公告)号:CN103559510B

    公开(公告)日:2017-01-18

    申请号:CN201310562450.5

    申请日:2013-11-12

    Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。

    一种利用紧凑视频主题描述子进行视频检索的方法

    公开(公告)号:CN103279581B

    公开(公告)日:2016-08-17

    申请号:CN201310255896.3

    申请日:2013-06-25

    Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。

    一种基于深度学习的聚类方法

    公开(公告)号:CN103530689B

    公开(公告)日:2016-01-20

    申请号:CN201310530626.9

    申请日:2013-10-31

    Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。

    一种基于空间共聚集的图像分类方法

    公开(公告)号:CN103034871B

    公开(公告)日:2015-09-23

    申请号:CN201210560743.5

    申请日:2012-12-20

    Inventor: 王亮 黄永祯 刘锋

    Abstract: 本发明公开了一种基于空间共聚集的图像分类方法。在该方法中,首先,提取局部特征并用聚类算法得到视觉词典;然后,用编码算法对特征进行编码,将不同空间区域的特征聚集并串联到一起;最后,用通用的特征选择方法进行特征选择,并用选择的特征作为图像的表达以训练分类器用于对图像进行分类。本发明方法从不同空间区域组合的表达中选择最有区分力,更加鲁棒的特征作为图片的表达,从而可以反映特征在给定类别图片中的空间分布和共生信息。本发明方法能以极少的特征数量达到分类精度优于常规算法的效果。

    一种基于深度学习的步态识别方法

    公开(公告)号:CN104299012A

    公开(公告)日:2015-01-21

    申请号:CN201410587758.X

    申请日:2014-10-28

    CPC classification number: G06K9/66 G06K2209/21

    Abstract: 本发明公开一种基于深度学习的步态识别方法,包括:利用深度学习的卷积神经网络的较强的学习能力,通过共享权重的双通道卷积神经网络来根据视频中人的步态来识别其身份。该方法对跨较大视角的步态变化有很强的鲁棒性,有效地解决了现有步态识别技术在处理跨视角步态识别时精度不高的问题。该方法可被广泛应用于配备视频监控的场景,如:机场及超市的安全监控,人员识别,罪犯检测等。

Patent Agency Ranking