-
公开(公告)号:CN106056628A
公开(公告)日:2016-10-26
申请号:CN201610371378.1
申请日:2016-05-30
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
CPC classification number: G06T7/20 , G06T2207/10016 , G06T2207/20081
Abstract: 本发明提出基于深度卷积神经网络特征融合的目标跟踪方法及系统,涉及模式识别技术领域,该方法包括步骤1,通过深度卷积神经网络,获取视频图像中目标的多种特征,通过滤波器方法计算每种特征的特征置信权重,根据特征置信权重,获取目标当前的跟踪目标位置;步骤2,计算每种特征当前帧的预测精度损失,并根据预测精度损失,对每种特征,建立在△t时间内的稳定性模型,通过稳定性模型计算每个特征在当前帧的稳定性,根据每种特征的稳定性及累积的预测精度损失,更新每种特征的置信权重;步骤3,重复步骤1至步骤2完成所有帧的目标跟踪。本发明合理地融合多种特征的跟踪结果,实现鲁棒的目标跟踪。
-
公开(公告)号:CN103324954A
公开(公告)日:2013-09-25
申请号:CN201310214553.2
申请日:2013-05-31
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
Abstract: 本发明公开了一种基于树结构的图像分类方法及其系统,其中该方法包括:步骤一,提供具有标签信息的样本集合,以及根据标签信息的语义相关性构建的语义树结构;步骤二,根据该样本集合与该语义树结构,通过模型训练得到一组有监督的码本和分类器模型;步骤三,对于测试图像,利用训练得到的有监督的码本组生成多个中间层特征表示,根据该中间层特征表示并利用分类器模型预测该测试图像的类别标签。本发明克服了现有码本(特征)学习不能有效应对海量类别的分类问题。
-
公开(公告)号:CN102300094B
公开(公告)日:2013-04-03
申请号:CN201110262029.3
申请日:2011-09-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种视频编码方法,包括:1)根据每个宏块的受关注程度确定待选编码模式编码的视频与原始视频之间的视频失真D;2)根据视频失真D计算率失真优化(RDO)模型;3)根据RDO模型进行视频编码。本发明的上述方法考虑了人的主观视觉特性,能够在保证人的主观视频质量的条件下有效降低码率。
-
公开(公告)号:CN102883180A
公开(公告)日:2013-01-16
申请号:CN201110195375.4
申请日:2011-07-12
Applicant: 中国科学院计算技术研究所
IPC: H04N17/00
Abstract: 本发明提供一种视频质量评价方法,包括:10)将每个待测视频作为图上的一个节点来构建图,根据视频总数量确定需要添加到图上的边的数量,其中观测者成对比较视频的比较结果对应于图的一个边;20)根据所述数量将比较结果映射到图上,将该图作为霍奇分解的输入;30)根据霍奇分解获得每段视频的质量得分。本发明所提供的上述方法在没有降低视频质量评价的准确度的前提下,操作简单、省时省力;而且适合用于网络众包。
-
公开(公告)号:CN101483542B
公开(公告)日:2011-04-13
申请号:CN200810056069.0
申请日:2008-01-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种对网络流媒体音视频的多维度的访问量统计方法,包括步骤:设置不同形式的音视频访问量统计方法,根据不同形式的访问量统计方法,获取相应的音视频的用户访问的反馈信息;根据用户访问的反馈信息,进行不同的处理,得到不同形式的访问量统计方法的音视频访问量。所述设置不同形式的音视频访问量统计方法,包括:音视频被完整访问的访问量统计方法;或者音视频被访问一定时间的访问量统计方法;或者音视频中的一个片断被访问的访问量统计方法;或者音视频中的多个片段被访问多次的访问量统计方法中的一种或者一种以上的组合。
-
公开(公告)号:CN101866429A
公开(公告)日:2010-10-20
申请号:CN201010195819.X
申请日:2010-06-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种多运动目标动作行为识别的训练方法,包括:从视频数据中提取每个运动目标的运动轨迹信息;为运动目标的运动轨迹信息分层,在各个所述层次上为多运动目标动作行为的运动模式建模;综合所述视频中的全局和局部的运动信息对所述运动模式的模型进行特征描述;所述特征至少包括使用高斯过程描述运动轨迹的三维超参数向量;根据特征训练分类器。本发明还提出了多运动目标动作行为识别方法,该方法利用训练方法得到的分类器实现视频中多运动目标动作行为的识别。本发明从概率角度使用高斯过程来表述目标的运动轨迹,从三个粒度层次上对多人行为模式进行建模提取特征,使得对多人行为的表述更符合实际。
-
公开(公告)号:CN101739428A
公开(公告)日:2010-06-16
申请号:CN200810226247.X
申请日:2008-11-10
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种对多媒体创建索引的方法,包括:将从与多媒体相关的语音或文本中所找到的人名在图像搜索引擎上搜索,根据搜索结果为所述人名建立对应的人脸库;为所述人脸库中的各个人脸以及所述视频的视频帧或所述图片中的待检测人脸分别提取特征;将所述的待检测人脸与所述人脸库中的各个人脸分别进行特征匹配,由匹配结果得知待检测人脸是否与人脸库所代表的人名匹配;将匹配的人名作为所述多媒体的索引。本发明的对多媒体创建索引的方法无需人为干预,无需事先标注数据,具有良好的扩展性;可以解决人脸匹配操作中常见的小样本量问题,能够方便快捷并且有效地对很小量的新闻报告中的人脸进行命名,并创建相关的索引。
-
公开(公告)号:CN101540041A
公开(公告)日:2009-09-23
申请号:CN200810102495.3
申请日:2008-03-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种扫描文档浏览适配方法,包括下列步骤:步骤A,对输入的扫描文档的原始页面图像,进行预处理,去掉噪音和不必要的背景信息;步骤B,判断并将所述原始页面图像划分为多个大横向部分,对每个大横向部分根据电子设备的屏幕宽度大小进行适配的分析处理;步骤C,根据分析处理结果,确定新的适配页面图像的版式安排,生成最后结果。其对扫描的图像格式的电子文档,自动转换为可供小尺寸屏幕阅读的版面模式,方便用户的使用。
-
公开(公告)号:CN101539925A
公开(公告)日:2009-09-23
申请号:CN200810102344.8
申请日:2008-03-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于关注度分析的音频文件摘要方法和基于此方法的音视频文件摘要方法。该音频文件摘要方法包括下列步骤:1)基于二叉层次型的分类树算法按照音频文件中的典型声音类型进行音频分类,其中二叉层次型的分类树算法在每一分类层选用不同特征和分类器;2)根据音频分类结果,对典型声音类型建立关注度分析模型,得到典型声音类型的关注度曲线;3)根据典型声音类型的关注度曲线确定摘要。该方法结合音视频文件的视觉模态分析可以更好的完成音视频文件摘要方法。本发明对音视频的分类效果好。选取符合人类主观情感规律的特征进行建模,具有框架扩展性强,可广泛适用于体育、影视、新闻、访谈等各类音视频文件的优点。
-
公开(公告)号:CN101242474A
公开(公告)日:2008-08-13
申请号:CN200710063788.0
申请日:2007-02-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种照片在小尺寸屏幕设备上的动态视频浏览方法,包括:检测图像中的感兴趣区域,所述感兴趣区域包括人物,文字,物体,以及对比度较高、能引起用户注意的区域;对视频大小做自适应调整,使感兴趣区域的大小与所述小尺寸屏幕设备相适应;确定图像中感兴趣区域的播放顺序,从而得到一系列的顺序对象区域;根据一系列顺序对象区域产生视频帧,生成最终的图像浏览视频。本发明可以自动地把分辨率相对较高图片转换成视频片断浏览,并在手机等小分辨率的设备屏幕上观看,而不忽略其中的重要细节;所得到的动态效果可以提高用户的视觉观看,丰富用户的浏览模式,在未来宽带无线多媒体通信的环境下有具有可预测的应用前景和市场价值。
-
-
-
-
-
-
-
-
-