-
公开(公告)号:CN100568263C
公开(公告)日:2009-12-09
申请号:CN200610074795.6
申请日:2006-04-14
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00463
Abstract: 布局分析设备和布局分析方法。本发明涉及能够高度准确地从图像(如果该图像为彩色图像)中提取文本块的布局分析设备、布局分析方法。布局分析方法包括:分割区域提取步骤,根据二值图像提取通过图案划分的区域,以使用该提取结果作为分割区域;字符要素集合提取步骤,针对各分割区域,对通过第一二值图像布局分析处理提取的字符要素集合进行提取,以使用该提取结果作为字符要素集合;文本块提取步骤,在各分割区域中提取包含有所提取的字符要素集合的区域,以避免与第二二值图像布局处理所提取的非字符要素交叠,并使用该提取结果作为文本块;以及布局信息生成步骤,根据所述文本块以及第二二值图像布局分析处理所提取的非字符要素,生成布局信息。
-
公开(公告)号:CN101520845A
公开(公告)日:2009-09-02
申请号:CN200810081557.7
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 提供了一种彩色文档图像的分层装置和方法。本发明的彩色文档图像分层装置执行如下处理:确定所述文档图像的背景色;将所述文档图像中的每个像素点映射到以所述背景色为原点的RGB空间中,构建反映了所述文档图像的像素点在所述RGB空间中的分布的特征平面;基于所述特征平面中的密度分布将所述特征平面分割为一个以上的区域;基于所述分割结果,将所述文档图像划分为一个以上的图层。
-
公开(公告)号:CN101452443A
公开(公告)日:2009-06-10
申请号:CN200810180800.0
申请日:2008-12-05
Applicant: 富士通株式会社
CPC classification number: G06F17/243
Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。
-
公开(公告)号:CN101425131A
公开(公告)日:2009-05-06
申请号:CN200810145884.4
申请日:2008-08-18
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 本发明提供了逻辑结构分析装置、方法和计算机产品。一种逻辑结构分析装置包括:提取部件,其从表单提取单词候选;第一生成部件,其将每个单词候选分类成标题候选的群组和数据候选的群组,以基于单词候选在表单上的位置,生成第一候选集合,每个第一候选集合包括一个标题候选和可由该标题候选标识的一个数据候选;第二生成部件,其组合第一候选集合,以生成第二候选集合,使得每一个包括多个不同的标题候选和一个数据候选;去除部件,其基于每个第二候选集合中的标题候选和数据单词候选的位置,从第二候选集合中去除包括一数据项和标识该数据项的标题的已确定集合;以及输出部件,其输出已确定集合。
-
公开(公告)号:CN101373519A
公开(公告)日:2009-02-25
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN101359373A
公开(公告)日:2009-02-04
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
公开(公告)号:CN1213382C
公开(公告)日:2005-08-03
申请号:CN01125404.1
申请日:2001-08-15
Applicant: 富士通株式会社
CPC classification number: G06K9/346 , G06K2209/01 , G06T7/11 , G06T7/12 , G06T2207/10008 , G06T2207/30176
Abstract: 从一个多值图象产生一个比较扩张的二值化图象和一个比较模糊的二值化图象。从该比较扩张的二值化图象提取一个划线候选区,且利用该比较模糊的二值化图象检验提取的划线候选区。
-
公开(公告)号:CN1207673C
公开(公告)日:2005-06-22
申请号:CN02105803.2
申请日:2002-04-10
Applicant: 富士通株式会社
CPC classification number: G06K9/346 , G06K2209/01 , G06T5/002 , G06T5/20 , H04N1/409
Abstract: 在一个包括半色调点网遮盖字符的原始图案被输入并且对该原始图象使用了预定处理之后,黑象素连接图案被从目标处理区域中提取出来。如果所提取的图案的密度超出预定密度,则判定该图案是被半色调点网遮盖的,并且计算连接图案的垂直/水平尺寸各自的平均值和标准偏差。然后,根据各自的平均值和标准偏差来计算各自的阈值,并且半色调点图案被消除。进而,在剩余的所有连接图案中与所包含的黑象素相比轮廓线较长的图案被当作不必要的图案而消除。最后,附着于字符上的投影被删除,字符提取就结束了。
-
公开(公告)号:CN1187952C
公开(公告)日:2005-02-02
申请号:CN01117124.3
申请日:2001-04-26
Applicant: 富士通株式会社
CPC classification number: G06K9/3283 , G06K2209/01 , G06T3/0031 , G06T5/006 , G06T7/12 , G06T7/50 , G06T2207/10016 , G06T2207/30176
Abstract: 通过使用从顶部拍摄的一张图象的二维轮廓并限定纸为矩形的方法可以建立一个三维曲面模型。然后,根据所获得的三维曲面模型可以校正图象中的三维失真。
-
公开(公告)号:CN1151465C
公开(公告)日:2004-05-26
申请号:CN97120419.5
申请日:1997-10-09
Applicant: 富士通株式会社
IPC: G06K9/00
CPC classification number: G06K9/6857
Abstract: 通过在候选表中说明的变换,从输入模式的特征向量计算出的基准特征向量的值变换为候选种类集。然后,利用候选种类集进行模式识别。通过适当设定变换,在保持识别精度的同时进行高速处理。
-
-
-
-
-
-
-
-
-