-
公开(公告)号:CN101118597A
公开(公告)日:2008-02-06
申请号:CN200610166798.2
申请日:2006-11-30
Applicant: 富士通株式会社
CPC classification number: G06K9/00449
Abstract: 本发明提供了一种帐票处理方法、帐票处理装置以及计算机产品。该帐票处理装置从帐票文件提取版面信息和字符信息。候选提取单元从字符信息提取候选单词。频率数字化单元根据各个元素计算候选单词的出现概率。关系数字化单元计算建立候选单词之间关系的迁移概率。评价单元计算表示各逻辑元素中的候选单词的出现概率的评价值。确定单元根据该评价值,将该元素及其候选单词确定为帐票文件中的元素及其字符串。
-
公开(公告)号:CN1534542A
公开(公告)日:2004-10-06
申请号:CN03132852.0
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1534539A
公开(公告)日:2004-10-06
申请号:CN03132851.2
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 表格形式识别设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN104247410A
公开(公告)日:2014-12-24
申请号:CN201280071928.8
申请日:2012-03-30
Applicant: 富士通株式会社
CPC classification number: G09G5/06 , G01J3/524 , G01J2003/466 , G06K9/3216 , G06K9/4652 , H04N1/6033
Abstract: 本发明提供一种从具有按照规定的排列配置的多个调色板的彩色图表所映现出的图像,对该彩色图表进行检测的彩色图表检测装置。该彩色图表检测装置针对至少三个以上的规定数量的调色板,分别从图像提取具有与该调色板相当的颜色成分的像素,将规定数量的调色板中至少三个调色板设为第一组,在从针对该第一组所包含的调色板分别提取出的像素中按各个调色板选择出的像素的组合按照调色板的规定的排列并排的情况下将该组合所包含的像素检测为存在第一组的对应的调色板映现的可能性的候补像素,基于候补像素来求得表示与该候补像素对应的调色板的图像上的颜色的颜色信息以及表示该调色板的图像上的位置的位置信息。
-
公开(公告)号:CN102024138B
公开(公告)日:2013-01-23
申请号:CN200910173692.9
申请日:2009-09-15
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
-
公开(公告)号:CN101430761B
公开(公告)日:2012-10-10
申请号:CN200810174108.7
申请日:2008-11-07
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00449
Abstract: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。
-
公开(公告)号:CN102208022A
公开(公告)日:2011-10-05
申请号:CN201010137689.4
申请日:2010-03-31
Applicant: 富士通株式会社
Abstract: 本发明公开了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。根据本发明的遮挡字符恢复方法包括:根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。
-
公开(公告)号:CN102024138A
公开(公告)日:2011-04-20
申请号:CN200910173692.9
申请日:2009-09-15
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
-
公开(公告)号:CN101622632A
公开(公告)日:2010-01-06
申请号:CN200780052064.4
申请日:2007-03-08
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01
Abstract: 一种账票种类识别装置,与各账票种类对应地预先保持存储了成为用于识别账票种类的关键的多个关键字的账票种类识别信息DB,对账票上所填写的字符串进行排列,使用账票种类识别信息DB中所存储的多个关键字,对每个关键字分别生成用于与账票上所填写的字符串进行对照的多个部分字符串,分别对照排列后的各组字符串和所生成的各部分字符串,对于对照成功了的各部分字符串,在对每个关键字取得各部分字符串相对于各组字符串的对照率最大时的正确解字符数以后,使用各正确解字符数对每个账票种类计算出评价了是该账票种类的可能性的评价值以决定账票种类。
-
公开(公告)号:CN101510252A
公开(公告)日:2009-08-19
申请号:CN200910007304.X
申请日:2009-02-11
Applicant: 富士通株式会社
CPC classification number: G06K9/72 , G06K9/348 , G06K9/6296 , G06K2209/01
Abstract: 本发明涉及区域提取程序、字符识别程序以及字符识别装置。该区域提取方法包括以下步骤:获取表示单位区域之间的接续关系的字符点阵,所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的;针对所获取的字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合,来判定所述组合是否可能成立;生成连接在与被判定为可能成立的单元区域的组合相对应的节点之间的路径;基于与所述规则点阵或者所述字符点阵的一致程度来确定所生成的路径中的最优路径;以及从图像中提取所述字符点阵中的与所确定的最优路径相对应的单位区域。
-
-
-
-
-
-
-
-
-