文本行检测方法和装置
    62.
    发明公开

    公开(公告)号:CN102054271A

    公开(公告)日:2011-05-11

    申请号:CN200910221163.1

    申请日:2009-11-02

    Abstract: 本发明公开了一种文本行检测方法和装置。所述文本行检测方法包括:灰度分解步骤:对灰度图像进行灰度分解,以获得所述灰度图像的文本层;笔划提取步骤:对所述灰度图像进行笔划提取,以获得所述灰度图像的笔划层;一致性验证步骤:验证所述文本层和所述笔划层中的连通域的一致性,并且基于验证结果从所述文本层中去除属于所述灰度图像的背景区域的连通域;以及文本行生成步骤:将去除了属于所述灰度图像的背景区域的连通域的所述文本层中的连通域组织成文本行。本发明的文本行检测方法和装置能够有效和高效地检测出呈现在图像或视频帧中的具有相对复杂的背景的文本行。

    字符识别装置及其字符识别方法

    公开(公告)号:CN101789073A

    公开(公告)日:2010-07-28

    申请号:CN200910006036.X

    申请日:2009-01-22

    Abstract: 本发明公开了一种字符识别装置及其字符识别方法。根据本发明的字符识别装置包括:字符识别单元,配置为用于识别字符图像并输出一个或者更多个候选字符和对应的识别置信度分数;注音搜索单元,配置为用于从字典中搜索每个候选字符的注音;注音校验单元,配置为用于通过将每个候选字符的注音与所述字符图像的注音图像相比较计算每个候选字符的类似度分数;一致性评估单元,配置为用于通过组合每个候选字符的识别置信度分数和对应的类似度分数评估每个候选字符的识别分数;以及输出单元,配置为用于根据每个候选字符的评估的识别分数输出识别结果。

    用于文档图像的自适应二值化方法和设备

    公开(公告)号:CN101727583A

    公开(公告)日:2010-06-09

    申请号:CN200810171184.2

    申请日:2008-10-22

    Abstract: 用于文档图像的自适应二值化方法和设备。自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。

    逻辑结构模型创建辅助设备和方法,用于其的记录介质

    公开(公告)号:CN101452443A

    公开(公告)日:2009-06-10

    申请号:CN200810180800.0

    申请日:2008-12-05

    CPC classification number: G06F17/243

    Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。

    逻辑结构分析装置、方法和计算机产品

    公开(公告)号:CN101425131A

    公开(公告)日:2009-05-06

    申请号:CN200810145884.4

    申请日:2008-08-18

    CPC classification number: G06K9/00469

    Abstract: 本发明提供了逻辑结构分析装置、方法和计算机产品。一种逻辑结构分析装置包括:提取部件,其从表单提取单词候选;第一生成部件,其将每个单词候选分类成标题候选的群组和数据候选的群组,以基于单词候选在表单上的位置,生成第一候选集合,每个第一候选集合包括一个标题候选和可由该标题候选标识的一个数据候选;第二生成部件,其组合第一候选集合,以生成第二候选集合,使得每一个包括多个不同的标题候选和一个数据候选;去除部件,其基于每个第二候选集合中的标题候选和数据单词候选的位置,从第二候选集合中去除包括一数据项和标识该数据项的标题的已确定集合;以及输出部件,其输出已确定集合。

Patent Agency Ranking