自然场景图像文字检测方法

    公开(公告)号:CN101436299A

    公开(公告)日:2009-05-20

    申请号:CN200810137571.4

    申请日:2008-11-19

    Abstract: 自然场景图像文字检测方法,它涉及一种通过采用纹理描述子LHBP来描述图像纹理特征并采用多尺度向性滤波的方法进行图像中的文字检测的方法,以解决基于纹理的文字检测方法存在的对光照的要求较复杂、文字与背景对比度变化对检测影响较大的问题。获得LHBP向性纹理编码及其根据位置权重变化而产生的相应编码,通过多尺度向性分析的方法确定文字区域。本发明采用LHBP纹理描述算子在多尺度的小波特征上提取局部纹理模式,能够滤掉复杂和文字-背景对比度变化情况的影响,有效地提取文字区域的纹理特征;并利用了文字区域的纹理方向特性确定最终文字区域,在复杂光照、文字-背景对比度变化以及文字的大小、笔画粗细变化等方面,具有很好的鲁棒性。

    基于互训练的流形对图像资源和文字进行融合的方法

    公开(公告)号:CN101430690A

    公开(公告)日:2009-05-13

    申请号:CN200810137509.5

    申请日:2008-11-12

    CPC classification number: G06K9/6252

    Abstract: 基于互训练的流形对图像资源和文字进行融合的方法,涉及图像检索和模式识别技术。它解决了现有的图像检索方法存在的检索精度较差的问题。本发明的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原始流形进行降维处理,得到低维拓扑结构以及相似性度量st(x,y),t的初始值为0;步骤三、对低维拓扑结构进行相似度迭代,得到两幅图像间的相似度;步骤四、根据两幅图像的相似度得到两幅图像样本点之间的收缩率;步骤五、根据步骤四得到的收缩率,对流形进行收缩调整;步骤六、若得到的流形收敛,则融合结束;若得到的流形不收敛,则令t=t+1,并返回执行步骤二。本发明适用于图像处理和图像检索领域。

    视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法

    公开(公告)号:CN101425069A

    公开(公告)日:2009-05-06

    申请号:CN200810137510.8

    申请日:2008-11-12

    Abstract: 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在同一视频镜头内共同出现的频度,来计算视频场景的关联关系G ,并利用视频场景之间的关联关系进行视频快速浏览与检索。本发明不受场景表观上的影响,能够准确的表达两个视频场景之间的物理关联关系,从而解决了传统方法准确率和查全率不高的问题。

    视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法

    公开(公告)号:CN101425069B

    公开(公告)日:2010-07-14

    申请号:CN200810137510.8

    申请日:2008-11-12

    Abstract: 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在同一视频镜头内共同出现的频度,来计算视频场景的关联关系G ,并利用视频场景之间的关联关系进行视频快速浏览与检索。本发明不受场景表观上的影响,能够准确的表达两个视频场景之间的物理关联关系,从而解决了传统方法准确率和查全率不高的问题。

    一种视频中的人物动作检测方法

    公开(公告)号:CN101430689A

    公开(公告)日:2009-05-13

    申请号:CN200810137508.0

    申请日:2008-11-12

    Abstract: 一种视频中的人物动作检测方法,它涉及一种基于内容的视频检测方法,以解决现有的多媒体信息检索方法不能够检测视频素材中的动作信息的问题。本发明通过基于Graph Partition Model的镜头边界检测方法对视频的镜头进行分割;对于连续的视频帧,通过在各帧显著图的基础上建立动态显著模型的方法得到时空显著图;计算得到时空显著图的注意力转移:设置一个阈值并将超过阈值的注意力转移值分离出来;在同一个动作内,对分离出的注意力转移值进行各帧叠加的3D序列切片,建立动作检测模型。本发明可以将大量的视频素材按照其包含的人物动作语义信息进行索引,方便用户对视频进行快速的浏览与检索,观看自己感兴趣的内容。

Patent Agency Ranking