基于深度卷积神经网络特征融合的目标跟踪方法及系统

    公开(公告)号:CN106056628B

    公开(公告)日:2019-06-18

    申请号:CN201610371378.1

    申请日:2016-05-30

    Abstract: 本发明提出基于深度卷积神经网络特征融合的目标跟踪方法及系统,涉及模式识别技术领域,该方法包括步骤1,通过深度卷积神经网络,获取视频图像中目标的多种特征,通过滤波器方法计算每种特征的特征置信权重,根据特征置信权重,获取目标当前的跟踪目标位置;步骤2,计算每种特征当前帧的预测精度损失,并根据预测精度损失,对每种特征,建立在△t时间内的稳定性模型,通过稳定性模型计算每个特征在当前帧的稳定性,根据每种特征的稳定性及累积的预测精度损失,更新每种特征的置信权重;步骤3,重复步骤1至步骤2完成所有帧的目标跟踪。本发明合理地融合多种特征的跟踪结果,实现鲁棒的目标跟踪。

    一种基于时序信息的跨视角动作识别方法及系统

    公开(公告)号:CN104200218B

    公开(公告)日:2018-02-06

    申请号:CN201410406317.5

    申请日:2014-08-18

    Abstract: 本发明公开了一种基于时序信息的跨视角动作识别方法及系统,本发明涉及模式识别领域技术。该方法包括检测视频的感兴趣点,提取该感兴趣点的运动强度,该视频包括:源视角视频和目标视角视频;根据该视频的该时序信息将该运动强度进行时序积累,获得该视频的运动特征描述;根据该运动特征描述和该源视角视频的源粗粒度标注信息,对该目标视角视频进行粗粒度标注,获得目标粗粒度标注信息;根据该源粗粒度标注信息和该目标粗粒度标注信息,通过度量学习方法,对该源视角视频和该目标视角视频进行度量学习,获得跨视角度量方法;通过该跨视角度量方法对该目标视角视频中的动作进行动作分类,以完成跨视角的动作识别。

    一种基于树结构的图像分类方法及其系统

    公开(公告)号:CN103324954B

    公开(公告)日:2017-02-08

    申请号:CN201310214553.2

    申请日:2013-05-31

    Abstract: 本发明公开了一种基于树结构的图像分类方法及其系统,其中该方法包括:步骤一,提供具有标签信息的样本集合,以及根据标签信息的语义相关性构建的语义树结构;步骤二,根据该样本集合与该语义树结构,通过模型训练得到一组有监督的码本和分类器模型;步骤三,对于测试图像,利用训练得到的有监督的码本组生成多个中间层特征表示,根据该中间层特征表示并利用分类器模型预测该测试图像的类别标签。本发明克服了现有码本(特征)学习不能有效应对海量类别的分类问题。

    基于多模态信息融合与图聚类的跨媒体话题检测方法、装置

    公开(公告)号:CN103995804A

    公开(公告)日:2014-08-20

    申请号:CN201410203087.2

    申请日:2014-05-14

    Abstract: 本发明公开了一种基于多模态信息融合与图聚类的跨媒体话题检测方法、装置,其中该方法包括:步骤一,进行文本信息、视频内容预处理;步骤二,进行文本融合及高层特征提取,获取文本信息相似度;步骤三,进行视频相似片段检测,获取视觉信息相似度;步骤四,根据文本信息相似度、视觉信息相似度并融合数据的时间信息计算最终数据相似度;步骤五,根据最终数据相似度进行图融合、图聚类,完成话题检测。该方法有效避免了对时间轴的硬量化带来的过分割与过生成的问题以及现有话题检测方法无法移植到来自不同媒体源的多模态数据的话题检测问题。

    一种视频质量客观评价方法

    公开(公告)号:CN102883179A

    公开(公告)日:2013-01-16

    申请号:CN201110194206.9

    申请日:2011-07-12

    Abstract: 本发明提供一种视频质量客观评价方法,包括:10)在相同时间点切分源视频和待测视频,得到视频片段;20)分别提取来自源视频和待测视频的视频片段中视频帧的视频块,利用时空纹理特征计算对应视频块的相似度,其中所述时空纹理特征体现了像素之间的像素差异;30)根据对应视频块的相似度计算来自待测视频的视频帧的质量分数;40)根据来自待测视频的视频帧的质量分数计算来自待测视频的视频片段的质量值,进而计算待测视频的质量分数。上述方法所获得的质量分数更加符合人的主观感知。

    多运动目标动作行为识别的训练方法和识别方法

    公开(公告)号:CN101866429B

    公开(公告)日:2012-09-05

    申请号:CN201010195819.X

    申请日:2010-06-01

    Abstract: 本发明提供一种多运动目标动作行为识别的训练方法,包括:从视频数据中提取每个运动目标的运动轨迹信息;为运动目标的运动轨迹信息分层,在各个所述层次上为多运动目标动作行为的运动模式建模;综合所述视频中的全局和局部的运动信息对所述运动模式的模型进行特征描述;所述特征至少包括使用高斯过程描述运动轨迹的三维超参数向量;根据特征训练分类器。本发明还提出了多运动目标动作行为识别方法,该方法利用训练方法得到的分类器实现视频中多运动目标动作行为的识别。本发明从概率角度使用高斯过程来表述目标的运动轨迹,从三个粒度层次上对多人行为模式进行建模提取特征,使得对多人行为的表述更符合实际。

    一种体育视频事件分析方法

    公开(公告)号:CN101354786B

    公开(公告)日:2011-07-06

    申请号:CN200710119387.2

    申请日:2007-07-23

    Abstract: 一种体育视频事件分析方法,包含通过提取场地中的标识线及场景分类方法识别事件发生的场地区域,对比赛事件的线路模式进行分类;通过对多对象轨迹的交互分析,针对比赛事件生成球和队员的交互轨迹,据此对比赛事件的交互模式进行层次化的由粗至细分析;最终,形成摘要性质的战术模式总结,呈现给用户。本发明对视频事件中队员(队伍)在完成一次战术动作时所采用战略方法进行从专业角度自动分析,以简洁、清晰的方式呈现出来,给教练和队员的学习和训练以帮助。

    人体动作识别的训练方法和识别方法

    公开(公告)号:CN101894276A

    公开(公告)日:2010-11-24

    申请号:CN201010195802.4

    申请日:2010-06-01

    CPC classification number: G06K9/00335 G06K9/4671 G06K2009/3291

    Abstract: 本发明提供一种人体动作识别的训练方法,包括:从视频文件中提取时空兴趣点;将所有时空兴趣点根据其所包含的特征描述子量化到相应的视频单词上,并为视频单词生成统计直方图;根据视频单词所在时空邻域内的时空上下文信息得到该视频单词所在时空邻域内的其它视频单词,由该视频单词与某一满足时空约束的其它视频单词形成时空视频词组;对视频单词所在时空邻域内的时空上下文做聚类,得到语境单词,由视频单词与语境单词形成时空视频单词团体;从时空视频词组中选择代表性时空视频词组,从时空视频单词团体中选择代表性时空视频单词团体;利用视频单词、代表性时空视频词组、代表性时空视频单词团体中的一种特征或将多种特征融合后的结果训练分类器。

    一种视频中周期性结构片段检测的方法及系统

    公开(公告)号:CN101404030A

    公开(公告)日:2009-04-08

    申请号:CN200810225562.0

    申请日:2008-11-05

    Abstract: 本发明涉及一种视频中周期性结构片段检测的方法及系统,所述方法包括:步骤1,从所述视频中删除重放片段;步骤2,以子镜头为单元对所述视频进行分解;步骤3,依据被分解出的子镜头间的相似度的距离对所述子镜头进行聚类;步骤4,根据所述子镜头在所述视频中的位置及所述子镜头所属的子镜头类,确定构成周期性结构片段的关键子镜头序列,并从所述视频中匹配出所有所述关键子镜头序列。本发明能够对视频中的周期性结构片段进行有效检测,且不依赖于特定领域知识,可应用到多种不同类型的视频上。

Patent Agency Ranking