-
公开(公告)号:CN101430758B
公开(公告)日:2012-10-10
申请号:CN200810174109.1
申请日:2008-11-07
Applicant: 富士通株式会社
CPC classification number: G06K9/2081 , G06K2209/01
Abstract: 本发明涉及文档识别装置和方法。一种文档识别装置,该文档识别装置包括显示控制单元,该显示控制单元显示包括与用户选择的字符串相关的字符串的文档数据,并显示至少包括该文档数据的字符串的区域。
-
-
公开(公告)号:CN102362489A
公开(公告)日:2012-02-22
申请号:CN200980158291.4
申请日:2009-03-25
Applicant: 富士通株式会社
IPC: H04N5/76
CPC classification number: H04N5/76 , G11B27/105 , H04N9/7921 , H04N9/8042 , H04N9/8205
Abstract: 执行再现控制程序的计算机和与该计算机执行同等功能的再现控制装置,当被输入了1个以上的关键字时,从事先提取出的1个以上的区间部分中检测表现包含该关键字的词语串的区间部分,经由再现单元连续再现检测出的区间部分。由此,可简单地仅视听保存在计算机内的视频内容中、利用者感兴趣的部分。
-
公开(公告)号:CN101452443B
公开(公告)日:2011-11-23
申请号:CN200810180800.0
申请日:2008-12-05
Applicant: 富士通株式会社
CPC classification number: G06F17/243
Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。
-
-
公开(公告)号:CN102129546A
公开(公告)日:2011-07-20
申请号:CN201010004431.7
申请日:2010-01-15
Applicant: 富士通株式会社
Abstract: 提供了一种二值图像的识别方法和装置,其中,在所述二值图像中包括表格线和笔划,所述方法包括:确定表格线的垂直和水平框线的位置;对所述表格线的垂直框线进行移除处理;对移除表格线的垂直框线后的二值图像进行细化;在细化后的二值图像上跟踪所述表格线的水平框线的最短路径;判断所跟踪的路径与笔划的相交类型,基于预设的相交类型和相应的相交部分是否是笔划部分的对应关系来确定所述跟踪路径上与所述笔划相交的部分是否是笔划部分;以及保留所述跟踪路径上的笔划部分,移除所述跟踪路径上的非笔划部分。
-
公开(公告)号:CN102054271A
公开(公告)日:2011-05-11
申请号:CN200910221163.1
申请日:2009-11-02
Applicant: 富士通株式会社
IPC: G06T7/00
Abstract: 本发明公开了一种文本行检测方法和装置。所述文本行检测方法包括:灰度分解步骤:对灰度图像进行灰度分解,以获得所述灰度图像的文本层;笔划提取步骤:对所述灰度图像进行笔划提取,以获得所述灰度图像的笔划层;一致性验证步骤:验证所述文本层和所述笔划层中的连通域的一致性,并且基于验证结果从所述文本层中去除属于所述灰度图像的背景区域的连通域;以及文本行生成步骤:将去除了属于所述灰度图像的背景区域的连通域的所述文本层中的连通域组织成文本行。本发明的文本行检测方法和装置能够有效和高效地检测出呈现在图像或视频帧中的具有相对复杂的背景的文本行。
-
公开(公告)号:CN101359373B
公开(公告)日:2011-01-12
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
公开(公告)号:CN101789073A
公开(公告)日:2010-07-28
申请号:CN200910006036.X
申请日:2009-01-22
Applicant: 富士通株式会社
Abstract: 本发明公开了一种字符识别装置及其字符识别方法。根据本发明的字符识别装置包括:字符识别单元,配置为用于识别字符图像并输出一个或者更多个候选字符和对应的识别置信度分数;注音搜索单元,配置为用于从字典中搜索每个候选字符的注音;注音校验单元,配置为用于通过将每个候选字符的注音与所述字符图像的注音图像相比较计算每个候选字符的类似度分数;一致性评估单元,配置为用于通过组合每个候选字符的识别置信度分数和对应的类似度分数评估每个候选字符的识别分数;以及输出单元,配置为用于根据每个候选字符的评估的识别分数输出识别结果。
-
公开(公告)号:CN101256630B
公开(公告)日:2010-06-30
申请号:CN200710078757.2
申请日:2007-02-26
Applicant: 富士通株式会社
Abstract: 本发明提供了用于改善文档图像二值化性能的去噪声装置和方法。该去噪声装置包括:灰度图像平滑单元,用于基于字符的笔画方向信息对灰度图像中的噪声点进行平滑,并输出经平滑的灰度图像;灰度图像二值化单元,用于对由所述灰度图像平滑单元输出的经平滑的灰度图像进行二值化,并输出进行了二值化的图像;二值图像噪声去除单元,用于基于字符的笔画宽度来去除由所述灰度图像二值化单元输出的进行了二值化的图像中的噪声点。
-
-
-
-
-
-
-
-
-