布局分析程序、布局分析设备和布局分析方法

    公开(公告)号:CN1987895A

    公开(公告)日:2007-06-27

    申请号:CN200610074795.6

    申请日:2006-04-14

    CPC classification number: G06K9/00463

    Abstract: 布局分析程序、布局分析设备和布局分析方法。能够高度准确地从图像(如果该图像为彩色图像)中提取文本块的布局分析程序、布局分析设备、布局分析方法和介质。布局分析程序使得计算机执行:分割区域提取步骤,根据二值图像提取通过图案划分的区域,以使用该提取结果作为分割区域;字符要素集合提取步骤,针对各分割区域,对通过第一二值图像布局分析处理提取的字符要素集合进行提取,以使用该提取结果作为字符要素集合;文本块提取步骤,在各分割区域中提取包含有所提取的字符要素集合的区域,以避免与第二二值图像布局处理所提取的非字符要素交叠,并使用该提取结果作为文本块;以及布局信息生成步骤,根据所述文本块以及第二二值图像布局分析处理所提取的非字符要素,生成布局信息。

    分析文件版面布局的设备和方法

    公开(公告)号:CN1264113C

    公开(公告)日:2006-07-12

    申请号:CN03102102.6

    申请日:2003-01-30

    CPC classification number: G06K9/00463

    Abstract: 在一个用于分析文件版面布局的设备中,一个字符候选元素生成器根据文件图像的黑像素链接分量生成字符候选元素。一个水平方向行矩形生成器在水平行方向上排列的字符候选元素之中当字符候选元素在垂直方向上相对于水平行方向的偏移量都小于或等于一个阈值时,将这多个字符候选元素设置为一个候选行矩形。一个水平方向段落块生成器将垂直方向上长度基本相同的多个候选行元素设置为一个段落候选元素。

    字符串提取设备和模式提取设备

    公开(公告)号:CN1220434A

    公开(公告)日:1999-06-23

    申请号:CN98125365.2

    申请日:1998-12-18

    Inventor: 武部浩明

    CPC classification number: G06K9/00463 G06K9/00469

    Abstract: 将从输入图像得到的连通元根据它们的相对位置和粗细相似性分组。然后,通过执行字符识别过程得到每个组的字符识别度。所得到的字符识别度用矩形区面积进行加权。在各组中,利用这些经加权的值的总和作为组的鉴定值,得到各种组合的鉴定值。将具有最高鉴定值的组的组合提取为一个字符串。

Patent Agency Ranking