帐票识别装置、方法、数据库生成装置、方法

    公开(公告)号:CN101685498B

    公开(公告)日:2016-04-20

    申请号:CN200910149359.4

    申请日:2009-06-18

    CPC classification number: G06K9/2054 G06K9/00449 G06K2209/01

    Abstract: 本发明提供一种不用将用于识别记载内容的信息按照设计不同的各个帐票进行登记即能范围广泛地应对帐票的帐票识别装置、方法、数据库生成装置、方法。关键字提取部(17)提取与项目名等对应的标题语句作为关键字。帐票类别判定部(18)着眼于所提取的关键字的种类、该关键字的提取位置等来判定帐票类别。逻辑结构分析(项目候补提取)部(20)以包含有字符串的区域即单元格为单位对表结构进行逻辑分析,提取单元格内存在的其他未识别的字符串,估计未识别的标题语句并进行恢复。这些操作通过反映帐票类别的判定结果来进行。由此,可实现更高精度的识别,并能应对范围更广的种类的帐票。

Patent Agency Ranking