一种利用紧凑视频主题描述子进行视频检索的方法

    公开(公告)号:CN103279581B

    公开(公告)日:2016-08-17

    申请号:CN201310255896.3

    申请日:2013-06-25

    Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。

    基于马尔科夫随机场的局部增量式可视化聚类方法

    公开(公告)号:CN103077404B

    公开(公告)日:2016-07-06

    申请号:CN201210593857.X

    申请日:2012-12-31

    Inventor: 王亮 钟黎 周振

    Abstract: 本发明公开了一种基于马尔可夫随机场的局部增量式可视化聚类方法,主要包括迭代和处理两个过程,其中:对完全未知的目标数据计算其相异度矩阵,将该矩阵作为迭代过程的输入,得到k阶邻域系统和忠实度矩阵;将迭代过程的输出作为处理过程的输入,得到重排序图像和聚类置信度等信息。该方法根据马尔可夫随机场的性质,采用k阶邻域系统计算全局概率测度;根据k阶邻域系统,通过降维来降低计算复杂度;根据忠实度矩阵,选择最佳划分类别,并且进一步给出聚类结果的置信度。该方法为聚类提供先验信息,直观地了解数据结构和数据类别的分布情况;同时,还能一次即可给出聚类结果和聚类评估;并给出数据隐含复杂结构和聚类置信度。

    一种基于深度学习的聚类方法

    公开(公告)号:CN103530689B

    公开(公告)日:2016-01-20

    申请号:CN201310530626.9

    申请日:2013-10-31

    Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。

    基于双向循环卷积网络的视频超分辨率方法和系统

    公开(公告)号:CN105072373A

    公开(公告)日:2015-11-18

    申请号:CN201510540560.0

    申请日:2015-08-28

    Inventor: 王亮 王威 黄岩

    Abstract: 本发明公开了一种基于双向循环卷积网络的视频超分辨率方法,包括:建立双向循环网络,包括按照时间顺序的前向循环子网络和后向循环子网络,每个循环子网络自底向上包含一个输入序列层,两个隐含序列层和一个输出序列层,每一序列层包括多个状态,对应于不同时刻的视频帧;用三种卷积操作来连接这些状态,包括前馈卷积,循环卷积和条件卷积,以得到双向循环卷积网络;把训练视频送到建立好的双向循环卷积网络中,利用随机梯度下降算法来最小化预测的和真实的高分辨率视频之间的均方误差,从而迭代地优化该网络的权重,并得到最终的双向循环卷积网络;向所述最终的双向循环卷积网络模型输入待处理的低分辨率视频序列,得到对应的超分辨率结果。

    基于高阶用户偏好的推荐方法

    公开(公告)号:CN105069140A

    公开(公告)日:2015-11-18

    申请号:CN201510511083.5

    申请日:2015-08-19

    CPC classification number: G06F17/30867

    Abstract: 一种基于高阶用户偏好的推荐方法,包括:利用用户-物品评分数据集,计算用户对成对物品的高阶偏好值,构建用户-物品-物品成对偏好数据集;初始化模型,从正态分布中随机选取值对模型初始化;从评分数据集和成对偏好数据集中选择相关数据;计算误差和用户偏好相似度,构成最优化准则;计算偏好指标梯度,更新模型;重复步骤直到模型参数收敛。本发明方法由OPTRP最优化准则和LearnRP学习算法组成,通过学习可以产生已有CF模型,且还可产生新模型,能有效地处理高度偏斜的评分数据集,使得推荐系统的预测精度和推荐准确度都得到提高,在真实场景中有重要的应用价值。

    一种基于空间共聚集的图像分类方法

    公开(公告)号:CN103034871B

    公开(公告)日:2015-09-23

    申请号:CN201210560743.5

    申请日:2012-12-20

    Inventor: 王亮 黄永祯 刘锋

    Abstract: 本发明公开了一种基于空间共聚集的图像分类方法。在该方法中,首先,提取局部特征并用聚类算法得到视觉词典;然后,用编码算法对特征进行编码,将不同空间区域的特征聚集并串联到一起;最后,用通用的特征选择方法进行特征选择,并用选择的特征作为图像的表达以训练分类器用于对图像进行分类。本发明方法从不同空间区域组合的表达中选择最有区分力,更加鲁棒的特征作为图片的表达,从而可以反映特征在给定类别图片中的空间分布和共生信息。本发明方法能以极少的特征数量达到分类精度优于常规算法的效果。

    基于双空间学习的跨媒体检索方法

    公开(公告)号:CN103049526B

    公开(公告)日:2015-08-05

    申请号:CN201210559081.X

    申请日:2012-12-20

    Abstract: 本发明公开了一种基于双空间学习的跨媒体检索方法。该方法包括:首先提取不同模态的多媒体数据的特征,利用双空间学习方法学习得到两个映射矩阵,将不同模态的数据映射到同一个空间;对于测试样本集,将其分为两部分:查询数据集和目标数据集,使用学习得到的映射矩阵将两个数据集的数据映射到统一空间,然后度量查询数据和目标数据之间的距离,并得到与查询数据距离最近的目标数据。本发明可以将不同模态的多媒体数据映射入统一空间进行度量,且在映射的同时进行了特征选择,提高了检索的鲁棒性和准确性,具有良好的运用前景。

    基于递归神经网络和人体骨架运动序列的行为识别方法

    公开(公告)号:CN104615983A

    公开(公告)日:2015-05-13

    申请号:CN201510043587.9

    申请日:2015-01-28

    Inventor: 王亮 王威 杜勇

    CPC classification number: G06K9/6227 G06N3/04

    Abstract: 本发明公开一种基于递归神经网络的人体骨架运动序列行为识别方法,包括以下步骤:对已经提取好的人体骨架姿态序列中节点坐标进行归一化,以消除人体所处绝对空间位置对识别过程的影响,利用简单平滑滤波器对骨架节点坐标滤波以提高信噪比,最后将平滑后的数据送入一个层次化双向递归神经网络进行深度特征提取及识别,同时提供了一种层次化单向递归神经网络模型以应对实际中的实时在线分析需求。该方法主要优点是根据人体结构特征及运动的相对性,设计端到端的分析模式,在实现高精度识别率的同时避免复杂的计算,便于实际应用。该发明对于基于深度摄像机技术的智能视频监控、智能交通管理及智慧城市等领域具有重要意义。

    一种基于深度学习的步态识别方法

    公开(公告)号:CN104299012A

    公开(公告)日:2015-01-21

    申请号:CN201410587758.X

    申请日:2014-10-28

    CPC classification number: G06K9/66 G06K2209/21

    Abstract: 本发明公开一种基于深度学习的步态识别方法,包括:利用深度学习的卷积神经网络的较强的学习能力,通过共享权重的双通道卷积神经网络来根据视频中人的步态来识别其身份。该方法对跨较大视角的步态变化有很强的鲁棒性,有效地解决了现有步态识别技术在处理跨视角步态识别时精度不高的问题。该方法可被广泛应用于配备视频监控的场景,如:机场及超市的安全监控,人员识别,罪犯检测等。

    一种利用相关主题模型识别社会群体行为的方法

    公开(公告)号:CN103559510A

    公开(公告)日:2014-02-05

    申请号:CN201310562450.5

    申请日:2013-11-12

    Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。

Patent Agency Ranking