-
公开(公告)号:CN102129546A
公开(公告)日:2011-07-20
申请号:CN201010004431.7
申请日:2010-01-15
Applicant: 富士通株式会社
Abstract: 提供了一种二值图像的识别方法和装置,其中,在所述二值图像中包括表格线和笔划,所述方法包括:确定表格线的垂直和水平框线的位置;对所述表格线的垂直框线进行移除处理;对移除表格线的垂直框线后的二值图像进行细化;在细化后的二值图像上跟踪所述表格线的水平框线的最短路径;判断所跟踪的路径与笔划的相交类型,基于预设的相交类型和相应的相交部分是否是笔划部分的对应关系来确定所述跟踪路径上与所述笔划相交的部分是否是笔划部分;以及保留所述跟踪路径上的笔划部分,移除所述跟踪路径上的非笔划部分。
-
公开(公告)号:CN101789073A
公开(公告)日:2010-07-28
申请号:CN200910006036.X
申请日:2009-01-22
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别装置及其字符识别方法。根据本发明的字符识别装置包括:字符识别单元,配置为用于识别字符图像并输出一个或者更多个候选字符和对应的识别置信度分数;注音搜索单元,配置为用于从字典中搜索每个候选字符的注音;注音校验单元,配置为用于通过将每个候选字符的注音与所述字符图像的注音图像相比较计算每个候选字符的类似度分数;一致性评估单元,配置为用于通过组合每个候选字符的识别置信度分数和对应的类似度分数评估每个候选字符的识别分数;以及输出单元,配置为用于根据每个候选字符的评估的识别分数输出识别结果。
-
公开(公告)号:CN101727583A
公开(公告)日:2010-06-09
申请号:CN200810171184.2
申请日:2008-10-22
Applicant: 富士通株式会社
IPC: G06K9/38
Abstract: 用于文档图像的自适应二值化方法和设备。自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。
-
公开(公告)号:CN101373519A
公开(公告)日:2009-02-25
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN102129546B
公开(公告)日:2013-07-10
申请号:CN201010004431.7
申请日:2010-01-15
Applicant: 富士通株式会社
Abstract: 提供了一种二值图像的识别方法和装置,其中,在所述二值图像中包括表格线和笔划,所述方法包括:确定表格线的垂直和水平框线的位置;对所述表格线的垂直框线进行移除处理;对移除表格线的垂直框线后的二值图像进行细化;在细化后的二值图像上跟踪所述表格线的水平框线的最短路径;判断所跟踪的路径与笔划的相交类型,基于预设的相交类型和相应的相交部分是否是笔划部分的对应关系来确定所述跟踪路径上与所述笔划相交的部分是否是笔划部分;以及保留所述跟踪路径上的笔划部分,移除所述跟踪路径上的非笔划部分。
-
-
公开(公告)号:CN101373519B
公开(公告)日:2011-01-19
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN101819625A
公开(公告)日:2010-09-01
申请号:CN200910004694.5
申请日:2009-02-27
Applicant: 富士通株式会社
IPC: G06K9/00
Abstract: 本发明公开了一种识别设备和识别方法。该识别设备包括第一识别装置,被配置为对第一图像进行识别,以得到第一图像识别结果;第二识别结果预选装置,被配置为根据第一图像识别结果确定候选第二图像识别结果;和第二识别装置,被配置为基于候选第二图像识别结果对第二图像进行识别,以得到第二图像识别结果,其中,第一图像与第二图像具有对应关系。可选地,第二图像是字符图像,第一图像是该字符图像对应的注音图像。本发明可以提高识别的准确度。
-
公开(公告)号:CN101520783A
公开(公告)日:2009-09-02
申请号:CN200810080943.4
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 本发明提供了一种基于图像内容的关键词搜索方法和装置。该关键词搜索装置在所输入的文档图像中搜索并定位所输入的关键词,该关键词搜索装置包括:整体匹配单元,该整体匹配单元从所述文档图像中提取多个候选关键词图像区域,提取所述多个候选关键词图像区域的图像特征,将所述图像特征与所述关键词的特征进行匹配,以获得与所述多个候选关键词图像区域相对应的匹配距离;校验单元,该校验单元对匹配距离小的前N个候选关键词图像区域进行识别,计算识别候选和所述关键词之间的校验距离;过滤单元,该过滤单元计算所述匹配距离和所述校验距离的组合距离,并根据该组合距离滤除组合距离大的候选关键词图像区域。
-
公开(公告)号:CN101789073B
公开(公告)日:2013-06-26
申请号:CN200910006036.X
申请日:2009-01-22
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别装置及其字符识别方法。根据本发明的字符识别装置包括:字符识别单元,配置为用于识别字符图像并输出一个或者更多个候选字符和对应的识别置信度分数;注音搜索单元,配置为用于从字典中搜索每个候选字符的注音;注音校验单元,配置为用于通过将每个候选字符的注音与所述字符图像的注音图像相比较计算每个候选字符的类似度分数;一致性评估单元,配置为用于通过组合每个候选字符的识别置信度分数和对应的类似度分数评估每个候选字符的识别分数;以及输出单元,配置为用于根据每个候选字符的评估的识别分数输出识别结果。
-
-
-
-
-
-
-
-
-