-
公开(公告)号:CN101551861A
公开(公告)日:2009-10-07
申请号:CN200910131440.X
申请日:2009-03-30
Applicant: 富士通先端科技株式会社
CPC classification number: G06K9/346 , G06K9/00449 , G06K2209/01 , G06K2209/015
Abstract: 字符识别装置。本发明的目的在于提供一种能够减少字符识别时操作者的工作量、并且对字符框所使用的颜色没有限制的字符识别装置。首先将票据的彩色图像数据中由操作者指定的分析范围大致分类为背景、字符框及字符,根据该分类结果高精度地确定字符框,然后从去除了背景后的彩色图像数据中去除字符框,并对剩下的字符进行字符识别。
-
公开(公告)号:CN101551861B
公开(公告)日:2012-07-25
申请号:CN200910131440.X
申请日:2009-03-30
Applicant: 富士通先端科技株式会社
CPC classification number: G06K9/346 , G06K9/00449 , G06K2209/01 , G06K2209/015
Abstract: 字符识别装置。本发明的目的在于提供一种能够减少字符识别时操作者的工作量、并且对字符框所使用的颜色没有限制的字符识别装置。首先将票据的彩色图像数据中由操作者指定的分析范围大致分类为背景、字符框及字符,根据该分类结果高精度地确定字符框,然后从去除了背景后的彩色图像数据中去除字符框,并对剩下的字符进行字符识别。
-
公开(公告)号:CN101685498B
公开(公告)日:2016-04-20
申请号:CN200910149359.4
申请日:2009-06-18
Applicant: 富士通先端科技株式会社
CPC classification number: G06K9/2054 , G06K9/00449 , G06K2209/01
Abstract: 本发明提供一种不用将用于识别记载内容的信息按照设计不同的各个帐票进行登记即能范围广泛地应对帐票的帐票识别装置、方法、数据库生成装置、方法。关键字提取部(17)提取与项目名等对应的标题语句作为关键字。帐票类别判定部(18)着眼于所提取的关键字的种类、该关键字的提取位置等来判定帐票类别。逻辑结构分析(项目候补提取)部(20)以包含有字符串的区域即单元格为单位对表结构进行逻辑分析,提取单元格内存在的其他未识别的字符串,估计未识别的标题语句并进行恢复。这些操作通过反映帐票类别的判定结果来进行。由此,可实现更高精度的识别,并能应对范围更广的种类的帐票。
-
公开(公告)号:CN101685498A
公开(公告)日:2010-03-31
申请号:CN200910149359.4
申请日:2009-06-18
Applicant: 富士通先端科技株式会社
CPC classification number: G06K9/2054 , G06K9/00449 , G06K2209/01
Abstract: 本发明提供一种不用将用于识别记载内容的信息按照设计不同的各个帐票进行登记即能范围广泛地应对帐票的帐票识别装置、方法、数据库生成装置、方法以及程序。关键字提取部(17)提取与项目名等对应的标题语句作为关键字。帐票类别判定部(18)着眼于所提取的关键字的种类、该关键字的提取位置等来判定帐票类别。逻辑结构分析(项目候补提取)部(20)以包含有字符串的区域即单元格为单位对表结构进行逻辑分析,提取单元格内存在的其他未识别的字符串,估计未识别的标题语句并进行恢复。这些操作通过反映帐票类别的判定结果来进行。由此,可实现更高精度的识别,并能应对范围更广的种类的帐票。
-
-
-