-
公开(公告)号:CN101520783A
公开(公告)日:2009-09-02
申请号:CN200810080943.4
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 本发明提供了一种基于图像内容的关键词搜索方法和装置。该关键词搜索装置在所输入的文档图像中搜索并定位所输入的关键词,该关键词搜索装置包括:整体匹配单元,该整体匹配单元从所述文档图像中提取多个候选关键词图像区域,提取所述多个候选关键词图像区域的图像特征,将所述图像特征与所述关键词的特征进行匹配,以获得与所述多个候选关键词图像区域相对应的匹配距离;校验单元,该校验单元对匹配距离小的前N个候选关键词图像区域进行识别,计算识别候选和所述关键词之间的校验距离;过滤单元,该过滤单元计算所述匹配距离和所述校验距离的组合距离,并根据该组合距离滤除组合距离大的候选关键词图像区域。
-
公开(公告)号:CN100501760C
公开(公告)日:2009-06-17
申请号:CN01135946.3
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。
-
公开(公告)号:CN100422990C
公开(公告)日:2008-10-01
申请号:CN03132852.0
申请日:1997-12-26
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN101267493A
公开(公告)日:2008-09-17
申请号:CN200710088355.0
申请日:2007-03-16
Applicant: 富士通株式会社
CPC classification number: G06K9/3283 , G06K2009/363
Abstract: 本发明提供了透视变形文档图像的校正装置和方法。所述校正装置包括:水平消失点确定单元,用于检测所述透视变形文档图像的水平消失点;垂直消失点确定单元,用于检测所述透视变形文档图像的垂直消失点;透视变形校正变换单元,用于对所述透视变形文档图像进行校正;其中所述水平消失点确定单元包括直接水平线段检测单元和间接水平线段检测单元以及水平消失点检测单元,所述水平消失点检测单元根据直接水平线段检测单元所检测出的直接的水平线段和间接水平线段检测单元检测出的间接的水平线段检测水平消失点。
-
公开(公告)号:CN100412903C
公开(公告)日:2008-08-20
申请号:CN200480026638.7
申请日:2004-03-05
Applicant: 富士通株式会社
CPC classification number: G06T5/006 , G06T3/0031 , G06T3/608 , H04N1/387
Abstract: 从图像拍摄装置拍摄纸面而得到的图像中,以纸面的内容为线索,抽取在纸面曲面上互相平行的测地线的投影集合,同时从测地线的投影集合中,抽取形成与纸面曲面相应的网格面的网格线的投影集合。从而,根据测地线以及网格线的投影集合来推定纸面曲面,基于该纸面曲面来校正图像的失真。这样一来,在能够处理多样的失真种类的同时,即使在图像上只表示纸面的一部分时,也能够进行失真校正。
-
公开(公告)号:CN100367288C
公开(公告)日:2008-02-06
申请号:CN200610077004.5
申请日:1996-07-30
Applicant: 富士通株式会社
Inventor: 江口真一 , 胜又裕 , 千叶亘一 , 松野秀树 , 永野义博 , 牛田和秀 , 镰田英夫 , 松桥智浩 , 稲岡秀行 , 渡部英一 , 直井聪 , 坂根俊司 , 小原胜利 , 山本一范 , 渡边和人 , 木嶋顺之 , 山崎芳則 , 町田泰孝
Abstract: 一种适用于例如金融机构中处理文件的数据媒体处理装置和数据媒体处理方法。用于基于从其上的信息以任意格式描述的数据媒体读取的图象(19)而识别信息的数据媒体处理装置(30)的结构为,它包括装置(2)用于从读取的图象数据(19)抽取包含格式的数据媒体所唯有的特征并从这些特征确定要被识别的信息所出现的位置,以及图象识别装置(3)用于识别由前面的装置(2)所确定的位置处的图象(19)以鉴别信息,使得数据媒体处理装置(30)能够处理具有诸如私人票据等各种格式的文件。
-
公开(公告)号:CN1270277C
公开(公告)日:2006-08-16
申请号:CN03145746.0
申请日:2003-07-02
Applicant: 富士通株式会社
CPC classification number: H04N1/387 , G06T3/0031 , H04N1/047 , H04N1/195 , H04N1/19594 , H04N2201/0434 , H04N2201/0436 , H04N2201/04787
Abstract: 图像失真校正方法和设备。本发明公开了一种图像失真校正设备,该图像失真校正设备包括:图像输入部分,用于输入由成像部分成像的平坦矩形纸面的图像以作为输入图像;成像位置估计部分,用于根据输入图像内的矩形纸面的四个顶点,估计成像部分对于纸面的相对成像位置;矩形纸面估计部分,用于根据成像位置,估计矩形纸面在一个三维空间内的四个顶点;以及图像校正部分,用于根据成像位置和三维空间内的四个顶点,校正输入图像内纸面的透视变换失真,以输出一个输出图像。
-
公开(公告)号:CN1734472A
公开(公告)日:2006-02-15
申请号:CN200410058171.6
申请日:2004-08-13
Applicant: 富士通株式会社
IPC: G06K9/62
CPC classification number: G06K9/036 , G06K9/3266 , G06K9/6255 , G06K2209/01
Abstract: 本发明提供了一种用于在不同劣化水平下自动生成劣化字符图像的方法和装置,在本发明中,首先将字符图像绘制在景物平面上;根据不同的参数对景物平面进行平移和旋转;根据不同的参数确定字符图像在图像平面的投影区域;生成像素区域掩码;并且通过超级采样生成最终的劣化图像。从而可以在不同的劣化条件下生成各种劣化字符图像。所生成的合成字符可用于光学字符识别(OCR)中的性能评定和训练数据的扩充。
-
公开(公告)号:CN1220163C
公开(公告)日:2005-09-21
申请号:CN01135945.5
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文挡图象的关键字。
-
公开(公告)号:CN1220162C
公开(公告)日:2005-09-21
申请号:CN01135944.7
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。
-
-
-
-
-
-
-
-
-