-
公开(公告)号:CN101276327B
公开(公告)日:2010-06-23
申请号:CN200710091539.2
申请日:2007-03-27
Applicant: 富士通株式会社
Abstract: 本发明公开了地址识别装置。所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
-
公开(公告)号:CN101727583A
公开(公告)日:2010-06-09
申请号:CN200810171184.2
申请日:2008-10-22
Applicant: 富士通株式会社
IPC: G06K9/38
Abstract: 用于文档图像的自适应二值化方法和设备。自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。
-
公开(公告)号:CN101452443A
公开(公告)日:2009-06-10
申请号:CN200810180800.0
申请日:2008-12-05
Applicant: 富士通株式会社
CPC classification number: G06F17/243
Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。
-
公开(公告)号:CN101425131A
公开(公告)日:2009-05-06
申请号:CN200810145884.4
申请日:2008-08-18
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 本发明提供了逻辑结构分析装置、方法和计算机产品。一种逻辑结构分析装置包括:提取部件,其从表单提取单词候选;第一生成部件,其将每个单词候选分类成标题候选的群组和数据候选的群组,以基于单词候选在表单上的位置,生成第一候选集合,每个第一候选集合包括一个标题候选和可由该标题候选标识的一个数据候选;第二生成部件,其组合第一候选集合,以生成第二候选集合,使得每一个包括多个不同的标题候选和一个数据候选;去除部件,其基于每个第二候选集合中的标题候选和数据单词候选的位置,从第二候选集合中去除包括一数据项和标识该数据项的标题的已确定集合;以及输出部件,其输出已确定集合。
-
公开(公告)号:CN101373519A
公开(公告)日:2009-02-25
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN101359373A
公开(公告)日:2009-02-04
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
-
-
公开(公告)号:CN1162795A
公开(公告)日:1997-10-22
申请号:CN97102011.6
申请日:1997-01-08
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00463 , G06K9/6807
Abstract: 一种环境识别装置从一个输入图象中抽取第一个至第N个状态,并且从第一个至第N个模式识别装置中,调用相应于第一个至第N个状态的数据,以执行一个识别过程。
-
-
-
-
-
-
-
-