关键字识别方法和装置
    23.
    发明授权

    公开(公告)号:CN101571921B

    公开(公告)日:2012-07-25

    申请号:CN200810091299.0

    申请日:2008-04-28

    Abstract: 一种关键词识别方法和装置。其对多幅包含共有关键词的图案或文档中包含的共有关键词进行识别,首先根据包含共有关键词的区域的灰度值生成二值前景累积图,并确定可能的关键字分割段,识别出对应于每个可能的关键字分割段的识别字符,利用标准关键词中包含的关键字构成的关键字组合对与上述识别字符构成的关键字匹配对的对应关系、估计关键词中心的位置,利用对应于上述关键词中心的关键字匹配对生成一个图,利用图中的最大完全子图确定识别字符中正确的关键字,并识别出遗漏关键字和粘连关键字,判定上述共有关键词中包含了具有最大识别比例的关键词。

    帐票处理方法、帐票处理装置以及计算机产品

    公开(公告)号:CN101118597B

    公开(公告)日:2010-07-07

    申请号:CN200610166798.2

    申请日:2006-11-30

    CPC classification number: G06K9/00449

    Abstract: 本发明提供了一种帐票处理方法、帐票处理装置以及计算机产品。该帐票处理装置从帐票文件提取版面信息和字符信息。候选提取单元从字符信息提取候选单词。频率数字化单元根据各个元素计算候选单词的出现概率。关系数字化单元计算建立候选单词之间关系的迁移概率。评价单元计算表示各逻辑元素中的候选单词的出现概率的评价值。确定单元根据该评价值,将该元素及其候选单词确定为帐票文件中的元素及其字符串。

    图像识别装置、图像识别程序和图像识别方法

    公开(公告)号:CN101425141A

    公开(公告)日:2009-05-06

    申请号:CN200810174982.0

    申请日:2008-10-31

    CPC classification number: G06K9/2054 G06K2209/01

    Abstract: 图像识别装置、图像识别程序和图像识别方法。一种图像识别方法,该方法针对将各字符串分别描述为构成逻辑结构的多个逻辑元素的图像,并基于以对应于该逻辑结构的方式设置的逻辑结构模型来识别各逻辑元素,该方法包括以下步骤:收集关于待利用该逻辑结构模型处理的逻辑结构的图像的信息;在以对应于新逻辑结构的方式将该逻辑结构模型更新为新逻辑结构模型时,通过以更新后的逻辑结构模型来处理收集的信息而获得在基于更新后的结构模型针对与更新前的逻辑结构模型相对应的逻辑结构的图像进行识别时的识别结果;比较在利用更新前的逻辑结构模型处理所收集的信息时的识别结果是否和根据更新后的逻辑结构模型所获取的识别结果相匹配;并且在比较的结果为不匹配的情况下,向输出单元输出表示关于更新后的逻辑结构模型的警告的警告信息。

    字符识别装置、字符识别方法及计算机产品

    公开(公告)号:CN101364267A

    公开(公告)日:2009-02-11

    申请号:CN200810108259.2

    申请日:2008-06-05

    CPC classification number: G06K9/2054 G06K9/4671 G06K2209/01

    Abstract: 本发明公开了一种字符识别装置、字符识别方法及计算机产品,该字符识别装置包含哈希表注册单元和识别处理单元。哈希表注册单元创建哈希表,该哈希表将每个部分字符图像的特征表达为每个字符的区域。识别处理单元将输入图像划分为多个部分输入图像,并且计算每个部分输入图像的特征。识别处理单元在哈希表中查找具有与每个部分输入图像的特征相似的特征的部分字符图像。识别处理单元将多个部分输入图像之间的位置关系与多个部分字符图像之间的位置关系进行比较,以判定它们是否匹配,并识别出输入图像的每个区域中的字符。本发明能够以高准确度并高速识别出与任意形状的图案重叠的字符图像。

    帐票处理程序以及帐票处理装置

    公开(公告)号:CN101356541A

    公开(公告)日:2009-01-28

    申请号:CN200680050931.6

    申请日:2006-01-13

    CPC classification number: G06K9/2054 G06K9/72 G06K2209/01

    Abstract: 自动提取关键字。当输入扫描的帐票图像时,布局识别单元(11)提取帐票图像的读取区域,字符识别单元(13)对该读取区域进行字符识别。在帐票逻辑定义体数据库(14)中存储根据相同种类的帐票中共同的逻辑结构而定义了构成关键字的字符串的帐票逻辑定义体。字符串候选提取单元(15)将字符识别出的字符满足已定义的字符串关系的组合作为字符串候选提取。并且,对应单元(16)将字符串候选根据位置关系进行对应,确定构成关键字的字符串候选的组合。

    用于识别图像信息中的边界线的方法和装置

    公开(公告)号:CN101246549A

    公开(公告)日:2008-08-20

    申请号:CN200810005567.2

    申请日:2008-02-15

    CPC classification number: G06K9/4604 G06K9/00449 G06K2209/01

    Abstract: 本发明涉及用于识别图像信息中的边界线的方法和装置。根据本实施方式的一个方面,提供一种检测包含在图像信息中的边界线信息的方法,所述图像信息包括在第一状态和第二状态中的任一状态下的多个像素,所述方法包括以下步骤:检测连续布置在所述图像信息中的第一状态下的第一组像素以判定第一线信息,并检测彼此相邻布置并由第二状态下的像素包围的第一状态下的第二组像素以基于该第二组像素的轮廓来判定边缘信息;以及基于所述线信息和所述边缘信息的相对位置与第一和第二组像素的尺寸之间的关系的信息,来判定边界线信息。

    用于分析并确定文档中信息的相关性的装置和方法

    公开(公告)号:CN101236609A

    公开(公告)日:2008-08-06

    申请号:CN200810004819.X

    申请日:2008-02-02

    CPC classification number: G06K9/00463

    Abstract: 本发明涉及用于分析并确定文档中信息的相关性的装置和方法。该文档可为指定表格,其中包含多个模块,该多个模块中的至少一个模块包含表示表头的数据,该多个模块中的其余模块包含与表头信息关联的数据,该装置包括:用于存储多个模板的存储器,各模板具有多个节点、分别与该多个节点关联的字符数据以及该多个节点之间的相对位置信息;和根据一处理来分析并确定信息的相关性的处理器,该处理包括:获取该指定表格中的多个模块中包含的数据,确定该多个模块的相对位置以生成相对位置信息;与该模板的字符数据和该多个节点的相对位置信息相比较地,分析从该多个模块获取的数据及该多个模块的相对位置信息;以及确定该多个模块中包含的数据的相关性。

Patent Agency Ranking