-
公开(公告)号:CN1534542A
公开(公告)日:2004-10-06
申请号:CN03132852.0
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1534539A
公开(公告)日:2004-10-06
申请号:CN03132851.2
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 表格形式识别设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1471055A
公开(公告)日:2004-01-28
申请号:CN03145746.0
申请日:2003-07-02
Applicant: 富士通株式会社
CPC classification number: H04N1/387 , G06T3/0031 , H04N1/047 , H04N1/195 , H04N1/19594 , H04N2201/0434 , H04N2201/0436 , H04N2201/04787
Abstract: 图像失真校正方法和设备。本发明公开了一种图像失真校正设备,该图像失真校正设备包括:图像输入部分,用于输入由成像部分成像的平坦矩形纸面的图像以作为输入图像;成像位置估计部分,用于根据输入图像内的矩形纸面的四个顶点,估计成像部分对于纸面的相对成像位置;矩形纸面估计部分,用于根据成像位置,估计矩形纸面在一个三维空间内的四个顶点;以及图像校正部分,用于根据成像位置和三维空间内的四个顶点,校正输入图像内纸面的透视变换失真,以输出一个输出图像。
-
公开(公告)号:CN1094224C
公开(公告)日:2002-11-13
申请号:CN96111897.0
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。
-
公开(公告)号:CN1374623A
公开(公告)日:2002-10-16
申请号:CN01143306.X
申请日:2001-12-18
Applicant: 富士通株式会社
IPC: G06T5/50
CPC classification number: G06K9/38 , G06K2209/01 , G06T5/002 , G06T5/50 , G06T7/194 , G06T2207/30176
Abstract: 由彩色或黑白图像转换成的多层图像被输入,并且稍显模糊的二值图像生成单元生成包括稍显模糊的线图形和不包括背景干扰的稍显模糊的二值图像。而且,形状被保留的二值图像生成单元生成保留了线图形的形状并且包括背景干扰的二值图像。对于每个像素,这些图像被施以“与”操作,使得保留了该线图形的形状并且不包括背景干扰的二值图像被生成。
-
公开(公告)号:CN1164902A
公开(公告)日:1997-11-12
申请号:CN96191000.3
申请日:1996-07-30
Applicant: 富士通株式会社
Inventor: 江口真一 , 胜又裕 , 千叶亘一 , 松野秀树 , 永野义博 , 牛田和秀 , 镰田英夫 , 松桥智浩 , 稻冈秀行 , 渡部英一 , 直井聪 , 坂根俊司 , 小原胜利 , 山本一范 , 渡边和人 , 木顺之 , 山崎芳则 , 町田泰孝
IPC: G06K9/20
CPC classification number: G06K9/00469 , G06K9/00449 , G06K9/033
Abstract: 一种适用于例如金融机构中处理文件的数据媒体处理装置和数据媒体处理方法。用于基于从其上的信息以任意格式描述的数据媒体读取的图象(19)而识别信息的数据媒体处理装置(30)的结构为,它包括装置(2)用于从读取的图象数据(19)抽取包含格式的数据媒体所唯有的特征并从这些特征确定要被识别的信息所出现的位置,以及图象识别装置(3)用于识别由前面的装置(2)所确定的位置处的图象(19)以鉴别信息,使得数据媒体处理装置(30)能够处理具有诸如私人票据等各种格式的文件。
-
公开(公告)号:CN1153955A
公开(公告)日:1997-07-09
申请号:CN96111897.0
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。
-
公开(公告)号:CN106485192B
公开(公告)日:2019-12-06
申请号:CN201510556368.0
申请日:2015-09-02
Applicant: 富士通株式会社
Abstract: 本发明涉及用于图像识别的神经网络的训练方法和装置。该方法包括:将样本图像表示为高维空间中的点集,高维空间的大小为样本图像的空间域的大小×样本图像的强度域的大小;生成大小与高维空间的大小相同的第一随机扰动矩阵;对第一随机扰动矩阵进行平滑;用平滑后的第一随机扰动矩阵对高维空间中的点集进行扰动得到扰动后的点集;以及将扰动后的点集作为新的样本来训练神经网络。根据本发明,改进了传统的卷积神经网络的分类性能,产生更多的训练样本,减轻过拟合的影响,增强了卷积神经网络的泛化性能。
-
公开(公告)号:CN106296577B
公开(公告)日:2019-11-29
申请号:CN201510257323.3
申请日:2015-05-19
Applicant: 富士通株式会社
IPC: G06T3/40
Abstract: 公开了一种图像拼接方法和图像拼接设备。该图像拼接方法包括:对第一图像和第二图像进行粗对准,以得到两者的矩形重叠区域;将重叠区域的左下角与右上角之间的对角线的左侧部分作为第一图像的第一拼缝的左侧部分,并基于第一拼缝的左侧部分在第二图像中估计第二拼缝的左侧部分;将重叠区域的对角线的右侧部分作为第二图像的第二拼缝的右侧部分,并基于第二拼缝的右侧部分在第一图像中估计第一拼缝的右侧部分;基于第一拼缝和第二拼缝对重叠区域执行局部平滑变换;将第一图像和第二图像的非重叠区域与变换后的重叠区域进行组合,从而形成第一图像和第二图像的拼接图像。根据本公开的实施例,能够去除局部错误对准并且不需多次变换图像。
-
公开(公告)号:CN105335372B
公开(公告)日:2019-01-22
申请号:CN201410261004.5
申请日:2014-06-12
Applicant: 富士通株式会社
Abstract: 本公开提供了文档处理装置、方法以及确定文档图像的朝向的设备。文档处理装置包括:提取装置,用于从文档图像中提取出至少一个文本行;置信度获取装置,用于根据由所述提取装置提供的文本行的结构特征,获取所述文本行的、与第一类文本相关的置信度,所述置信度表示所述第一类文本相对于第二类文本的重要性程度;以及排序装置,用于至少根据所述置信度,对所述至少一个文本行中包含的文本的质量进行排序。
-
-
-
-
-
-
-
-
-