基于极小化上界误差的视觉跟踪方法

    公开(公告)号:CN102054170B

    公开(公告)日:2013-07-31

    申请号:CN201110021981.4

    申请日:2011-01-19

    Abstract: 本发明是基于极小化上界误差的视觉跟踪方法,利用跟踪器估计目标在当前帧中的区域,所述目标区域包括目标位置与目标大小;以估计的目标区域为参照提取样本;对提取的样本抽取两类不同性质的视觉特征;利用抽取的各样本两类不同性质的视觉特征在线进行协同提升学习,并对跟踪器进行更新,在线协同提升学习中,利用两个并行的提升算法同时对两类不同性质的视觉特征进行选择,并在各级视觉特征选择中利用协同学习进行相互约束,在选择最佳的视觉特征提升跟踪器性能的同时利用协同学习配置最佳的样本属性。跟踪器在线学习不需要输入样本的标注信息,在跟踪结果不完全准确的情况下也不会带来累计误差,从而保证了跟踪器的稳定性与可靠性。

    基于群组上下文的行人计数方法

    公开(公告)号:CN102289817B

    公开(公告)日:2013-04-17

    申请号:CN201110201983.1

    申请日:2011-07-19

    Abstract: 本发明提供一种基于群组上下文的行人计数方法,所述方法是根据固定监控摄像头采集的图像序列,提取运动前景图像;对相邻图像帧中的群组,建立群组距离矩阵;利用群组距离矩阵,建立群组相关性矩阵;利用群组相关性矩阵检测群组状态,并在图像序列中跟踪群组,以及识别群组事件中的群组关系,从而从群组出现到群组消失该时间段内建立群组上下文;利用内部群组上下文和外部群组上下文组建上下文掩模;根据上下文掩模构建最大联合后验概率估计问题,把基于单帧图像的行人计数问题推广到基于多帧图像上,用于统计监控场景中基于群组的行人人数。该方法有效降低遮挡、图像深度以及姿态变化给行人计数带来的误差,计数结果在时间域上具有一致性。

    基于视频监控网络的视频自动浓缩方法

    公开(公告)号:CN102256065B

    公开(公告)日:2012-12-12

    申请号:CN201110208090.X

    申请日:2011-07-25

    Abstract: 一种基于视频监控网络的视频自动浓缩方法,其是从两个具有重叠区域的摄像机获得第一视频源和第二视频源并对运动目标分割和跟踪,提取背景图像和视频监控网络运动轨迹;根据背景图像生成基于视频监控网络的全景图像,得到两个摄像机各自对应于全景图像的投影矩阵并实时更新基于视频监控网络背景的全景图像;利用两个摄像机全景图像的投影矩阵,把轨迹投影到全景图像空间得到投影轨迹;:采用图匹配,基于随机游走思想对两个摄像机的视频源的投影轨迹匹配,得到匹配轨迹对,对重叠区域的匹配轨迹进行选择和融合,得到完整的大场景轨迹;对大场景轨迹按时间重新排列,在全景图像上对完整的大场景轨迹进行展现,得到基于全景图像的视频浓缩。

    一种双人跳水同步性自动分析方法

    公开(公告)号:CN101470898B

    公开(公告)日:2012-04-11

    申请号:CN200710304226.0

    申请日:2007-12-26

    Abstract: 本发明提出双人跳水同步性分析的方法,主要包括:双人跳水动作视频中,基于动态背景重建的运动目标提取;基于跳水规则中同步性评分要素的同步性特征的表示和提取;采用偏好性统计学习方法构造同步性评价函数来进行同步性评价的方法。本发明能自动提取双人跳水动作视频中的运动员外轮廓。本发明根据跳水规则提出了有效的表示同步性特征的方法。本发明还把偏好性统计学习中常用的排序的思想引入到双人跳水动作视频的同步性评价函数构造问题中,把绝对分值问题转化成相对排序问题。最终,通过计算双人跳水动作视频的同步性评价函数值能够对双人跳水的同步性进行自动评定。本发明能够准确有效地自动评判双人跳水的同步性。

    基于多媒体分析的视频事件检测方法

    公开(公告)号:CN102298604A

    公开(公告)日:2011-12-28

    申请号:CN201110140400.9

    申请日:2011-05-27

    Abstract: 本发明是基于多媒体分析的视频事件检测方法,其包括:利用文本分析对视频进行分析,得到少量的自动标注视频数据;利用多个关键词,通过网络视频搜索引擎,得到事件相关的大量的视频数据;基于图模型的半监督多示例学习算法,利用少量的自动标注视频数据和事件相关的大量的视频数据进行训练,并且利用事件例子的相似度准则及事件包的正负属性准则,构建出事件的数学描述模型,并采取有约束的凸凹过程方法,对事件相关的大量的视频数据进行求解;局部相似度度量学习方法,利用样本的空间分布特性,学习得到有效的相似度,根据学习得到的事件模型实现事件识别和定位;根据事件模型,对视频的内容进行语义分析,得到视频中事件的位置信息。

    基于群组上下文的行人计数方法

    公开(公告)号:CN102289817A

    公开(公告)日:2011-12-21

    申请号:CN201110201983.1

    申请日:2011-07-19

    Abstract: 本发明提供一种基于群组上下文的行人计数方法,所述方法是根据固定监控摄像头采集的图像序列,提取运动前景图像;对相邻图像帧中的群组,建立群组距离矩阵;利用群组距离矩阵,建立群组相关性矩阵;利用群组相关性矩阵检测群组状态,并在图像序列中跟踪群组,以及识别群组事件中的群组关系,从而从群组出现到群组消失该时间段内建立群组上下文;利用内部群组上下文和外部群组上下文组建上下文掩模;根据上下文掩模构建最大联合后验概率估计问题,把基于单帧图像的行人计数问题推广到基于多帧图像上,用于统计监控场景中基于群组的行人人数。该方法有效降低遮挡、图像深度以及姿态变化给行人计数带来的误差,计数结果在时间域上具有一致性。

    一种对电影人脸图像进行自动标识的方法

    公开(公告)号:CN101833569A

    公开(公告)日:2010-09-15

    申请号:CN201010141915.6

    申请日:2010-04-08

    Abstract: 本发明涉及一种对电影人脸图像进行自动标识的方法,该方法包括:步骤1:利用多视角的人脸检测和跟踪器,在电影视频中自动获取人脸序列并进行聚类以对应不同的人物;步骤2:根据不同人物的人脸序列在相同场景中共同出现的频次度量人脸之间关系,建立人脸关系网络;步骤3:利用计算机从电影剧本数据库下载并存储与电影视频相对应的纯文本电影剧本,计算机统计纯文本电影剧本中不同人物的姓名在相同场景中共同出现的频次;步骤4:依据频次来度量人名之间的关系,建立人名关系网络;步骤5:计算机将人脸关系网络和人名关系网络的人脸无向图和人名无向图进行匹配,实现人脸关系网络和人名关系网络中顶点之间的匹配,实现将人脸和人名融合的标识。

    一种交互式图像检索方法
    18.
    发明授权

    公开(公告)号:CN101377776B

    公开(公告)日:2010-06-30

    申请号:CN200710121079.3

    申请日:2007-08-29

    Abstract: 本发明基于移动虚拟分类面的交互式图像检索方法,采用移动虚拟分类面选取图像的数据点;对图像数据点进行逐一标注;利用前一个标注的图像数据点选取下一个图像数据点;利用标注的图像数据点查找访问图像,完成交互式图像检索。在图像检索的相关反馈过程中,主动学习常常被用来减轻人工标注的数据量,其主要思想是每次仅仅选取信息量最大的数据进行标注。传统的成批标注的方法忽略了数据点之间的关系,因此不够高效。本发明提出移动虚拟分类面选点策略,利用前一个标注的数据去为下一个数据的选取提供指导,从而在不增加标注数据量的条件下提高了所标注数据总的信息量。移动虚拟分类面选点策略使主动学习算法性能得到了显著提高。

    一种具有最小误差的快速变尺寸块匹配的运动估计方法

    公开(公告)号:CN101026761A

    公开(公告)日:2007-08-29

    申请号:CN200610007814.3

    申请日:2006-02-17

    Abstract: 本发明涉及视频压缩技术领域,一种最小误差的快速变尺寸块匹配的运动估计方法。包括:改进的“自下而上”的变尺寸块匹配方法、宏模式预测方法和后处理方法;改进的变尺寸块匹配方法将匹配误差最小的运动矢量作为候选矢量,即将每一个小块的最小匹配误差设为阈值,使变尺寸块匹配方法的匹配误差达到最小;在宏模式预测时,前一个帧间预测帧的宏块模式选择结果用来指导随后帧间预测帧的宏块选择,如果当前帧的当前宏块对应的前一帧的块模式为宏块模式,则进行MMP运算。对应的运动矢量用作预测矢量;后处理方法进一步考察使用mini-模式表示的平滑区域,首先确定所有16个小块的匹配误差小于32,否则认为该区域存在复杂运动,使用mini-模式是合理的。

    基于张量分解的深度卷积神经网络的加速与压缩方法

    公开(公告)号:CN106127297B

    公开(公告)日:2019-07-12

    申请号:CN201610387878.4

    申请日:2016-06-02

    Abstract: 本发明公开了一种基于张量分解的深度卷积神经网络的加速与压缩方法。其中,所述方法至少包括:步骤1:获取原始深度卷积神经网络;步骤2:对所述原始深度卷积神经网络中各层的权值张量进行张量分解,得到多个低秩子张量;步骤3:用所述多个低秩子张量替换所述原始深度卷积神经网络中各层的权值张量,获得新的深度卷积神经网络。通过本发明实施例,实现了大型深度卷积神经网络的加速与压缩。

Patent Agency Ranking