基于互训练的流形对图像资源和文字进行融合的方法

    公开(公告)号:CN101430690A

    公开(公告)日:2009-05-13

    申请号:CN200810137509.5

    申请日:2008-11-12

    CPC classification number: G06K9/6252

    Abstract: 基于互训练的流形对图像资源和文字进行融合的方法,涉及图像检索和模式识别技术。它解决了现有的图像检索方法存在的检索精度较差的问题。本发明的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原始流形进行降维处理,得到低维拓扑结构以及相似性度量st(x,y),t的初始值为0;步骤三、对低维拓扑结构进行相似度迭代,得到两幅图像间的相似度;步骤四、根据两幅图像的相似度得到两幅图像样本点之间的收缩率;步骤五、根据步骤四得到的收缩率,对流形进行收缩调整;步骤六、若得到的流形收敛,则融合结束;若得到的流形不收敛,则令t=t+1,并返回执行步骤二。本发明适用于图像处理和图像检索领域。

    视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法

    公开(公告)号:CN101425069A

    公开(公告)日:2009-05-06

    申请号:CN200810137510.8

    申请日:2008-11-12

    Abstract: 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在同一视频镜头内共同出现的频度,来计算视频场景的关联关系G ,并利用视频场景之间的关联关系进行视频快速浏览与检索。本发明不受场景表观上的影响,能够准确的表达两个视频场景之间的物理关联关系,从而解决了传统方法准确率和查全率不高的问题。

    视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法

    公开(公告)号:CN101425069B

    公开(公告)日:2010-07-14

    申请号:CN200810137510.8

    申请日:2008-11-12

    Abstract: 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在同一视频镜头内共同出现的频度,来计算视频场景的关联关系G ,并利用视频场景之间的关联关系进行视频快速浏览与检索。本发明不受场景表观上的影响,能够准确的表达两个视频场景之间的物理关联关系,从而解决了传统方法准确率和查全率不高的问题。

    一种结合空间约束信息获取动作类别的方法

    公开(公告)号:CN101430757A

    公开(公告)日:2009-05-13

    申请号:CN200810137503.8

    申请日:2008-11-12

    Abstract: 一种结合空间约束信息获取动作类别的方法,涉及自动化监控领域,它解决了目前获取动作分类的方法训练时间过长和分类精度不高的问题。它的步骤为:读取视频,利用snake和粒子滤波器对目标轮廓区域内的目标进行跟踪,并在每一帧中都用一个矩形框精确框住目标区域;根据每一帧的目标区域的宽度和高度得到目标曲线和拟合函数,并通过对提取的特征值进行支持向量机分类,得到当前动作a被分类为第k类动作的先验概率,将视频划分为m个区域,得到区域i被第k类动作训练集中所有视频中所有帧所覆盖的概率以及所有分类动作在区域i中出现的概率和;根据当前动作a覆盖区域i的次数占训练集中所有视频区域被覆盖的总次数的比例得到当前动作a所属动作的类别数。

    一种结合空间约束信息获取动作类别的方法

    公开(公告)号:CN101430757B

    公开(公告)日:2010-12-01

    申请号:CN200810137503.8

    申请日:2008-11-12

    Abstract: 一种结合空间约束信息获取动作类别的方法,涉及自动化监控领域,它解决了目前获取动作分类的方法训练时间过长和分类精度不高的问题。它的步骤为:读取视频,利用snake和粒子滤波器对目标轮廓区域内的目标进行跟踪,并在每一帧中都用一个矩形框精确框住目标区域;根据每一帧的目标区域的宽度和高度得到目标曲线和拟合函数,并通过对提取的特征值进行支持向量机分类,得到当前动作a被分类为第k类动作的先验概率,将视频划分为m个区域,得到区域i被第k类动作训练集中所有视频中所有帧所覆盖的概率以及所有分类动作在区域i中出现的概率和;根据当前动作a覆盖区域i的次数占训练集中所有视频区域被覆盖的总次数的比例得到当前动作a所属动作的类别数。

    自然场景图像文字检测方法

    公开(公告)号:CN101436299A

    公开(公告)日:2009-05-20

    申请号:CN200810137571.4

    申请日:2008-11-19

    Abstract: 自然场景图像文字检测方法,它涉及一种通过采用纹理描述子LHBP来描述图像纹理特征并采用多尺度向性滤波的方法进行图像中的文字检测的方法,以解决基于纹理的文字检测方法存在的对光照的要求较复杂、文字与背景对比度变化对检测影响较大的问题。获得LHBP向性纹理编码及其根据位置权重变化而产生的相应编码,通过多尺度向性分析的方法确定文字区域。本发明采用LHBP纹理描述算子在多尺度的小波特征上提取局部纹理模式,能够滤掉复杂和文字-背景对比度变化情况的影响,有效地提取文字区域的纹理特征;并利用了文字区域的纹理方向特性确定最终文字区域,在复杂光照、文字-背景对比度变化以及文字的大小、笔画粗细变化等方面,具有很好的鲁棒性。

Patent Agency Ranking