-
公开(公告)号:CN101359373B
公开(公告)日:2011-01-12
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
公开(公告)号:CN101789073A
公开(公告)日:2010-07-28
申请号:CN200910006036.X
申请日:2009-01-22
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别装置及其字符识别方法。根据本发明的字符识别装置包括:字符识别单元,配置为用于识别字符图像并输出一个或者更多个候选字符和对应的识别置信度分数;注音搜索单元,配置为用于从字典中搜索每个候选字符的注音;注音校验单元,配置为用于通过将每个候选字符的注音与所述字符图像的注音图像相比较计算每个候选字符的类似度分数;一致性评估单元,配置为用于通过组合每个候选字符的识别置信度分数和对应的类似度分数评估每个候选字符的识别分数;以及输出单元,配置为用于根据每个候选字符的评估的识别分数输出识别结果。
-
公开(公告)号:CN101256630B
公开(公告)日:2010-06-30
申请号:CN200710078757.2
申请日:2007-02-26
Applicant: 富士通株式会社
Abstract: 本发明提供了用于改善文档图像二值化性能的去噪声装置和方法。该去噪声装置包括:灰度图像平滑单元,用于基于字符的笔画方向信息对灰度图像中的噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化单元,用于对由所述灰度图像平滑单元输出的经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除单元,用于基于字符的笔画宽度来去除由所述灰度图像二值化单元输出的进行了二值化的图像中的噪声点。
-
公开(公告)号:CN101276327B
公开(公告)日:2010-06-23
申请号:CN200710091539.2
申请日:2007-03-27
Applicant: 富士通株式会社
Abstract: 本发明公开了地址识别装置。所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
-
公开(公告)号:CN101727583A
公开(公告)日:2010-06-09
申请号:CN200810171184.2
申请日:2008-10-22
Applicant: 富士通株式会社
IPC: G06K9/38
Abstract: 用于文档图像的自适应二值化方法和设备。自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。
-
公开(公告)号:CN101520845A
公开(公告)日:2009-09-02
申请号:CN200810081557.7
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 提供了一种彩色文档图像的分层装置和方法。本发明的彩色文档图像分层装置执行如下处理:确定所述文档图像的背景色;将所述文档图像中的每个像素点映射到以所述背景色为原点的RGB空间中,构建反映了所述文档图像的像素点在所述RGB空间中的分布的特征平面;基于所述特征平面中的密度分布将所述特征平面分割为一个以上的区域;基于所述分割结果,将所述文档图像划分为一个以上的图层。
-
公开(公告)号:CN101373519A
公开(公告)日:2009-02-25
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN101359373A
公开(公告)日:2009-02-04
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
公开(公告)号:CN100458833C
公开(公告)日:2009-02-04
申请号:CN200310110287.5
申请日:2003-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/3266 , G06K2209/01
Abstract: 通过从给定的视频帧中去除多余的帧和非文本帧,选择包含文本区域的视频帧,通过去除伪笔划确定所选择的帧中的文本区域,提取文本区域中的文本行并进行二值化。
-
-
-
-
-
-
-
-
-