用于分析并确定文档中信息的相关性的装置和方法

    公开(公告)号:CN101236609B

    公开(公告)日:2012-09-05

    申请号:CN200810004819.X

    申请日:2008-02-02

    CPC classification number: G06K9/00463

    Abstract: 本发明涉及用于分析并确定文档中信息的相关性的装置和方法。该文档可为指定表格,其中包含多个模块,该多个模块中的至少一个模块包含表示表头的数据,该多个模块中的其余模块包含与表头信息关联的数据,该装置包括:用于存储多个模板的存储器,各模板具有多个节点、分别与该多个节点关联的字符数据以及该多个节点之间的相对位置信息;和根据一处理来分析并确定信息的相关性的处理器,该处理包括:获取该指定表格中的多个模块中包含的数据,确定该多个模块的相对位置以生成相对位置信息;与该模板的字符数据和该多个节点的相对位置信息相比较地,分析从该多个模块获取的数据及该多个模块的相对位置信息;以及确定该多个模块中包含的数据的相关性。

    用于识别图像信息中的边界线的方法和装置

    公开(公告)号:CN101246549B

    公开(公告)日:2012-07-25

    申请号:CN200810005567.2

    申请日:2008-02-15

    CPC classification number: G06K9/4604 G06K9/00449 G06K2209/01

    Abstract: 本发明涉及用于识别图像信息中的边界线的方法和装置。根据本实施方式的一个方面,提供一种检测包含在图像信息中的边界线信息的方法,所述图像信息包括在第一状态和第二状态中的任一状态下的多个像素,所述方法包括以下步骤:检测连续布置在所述图像信息中的第一状态下的第一组像素以判定第一线信息,并检测彼此相邻布置并由第二状态下的像素包围的第一状态下的第二组像素以基于该第二组像素的轮廓来判定边缘信息;以及基于所述线信息和所述边缘信息的相对位置与第一和第二组像素的尺寸之间的关系的信息,来判定边界线信息。

    区域提取方法、字符识别方法以及字符识别装置

    公开(公告)号:CN101510252B

    公开(公告)日:2012-05-30

    申请号:CN200910007304.X

    申请日:2009-02-11

    CPC classification number: G06K9/72 G06K9/348 G06K9/6296 G06K2209/01

    Abstract: 本发明涉及区域提取程序、字符识别程序以及字符识别装置。该区域提取方法包括以下步骤:获取表示单位区域之间的接续关系的字符点阵,所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的;针对所获取的字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合,来判定所述组合是否可能成立;生成连接在与被判定为可能成立的单元区域的组合相对应的节点之间的路径;基于与所述规则点阵或者所述字符点阵的一致程度来确定所生成的路径中的最优路径;以及从图像中提取所述字符点阵中的与所确定的最优路径相对应的单位区域。

    帐票处理装置以及帐票处理方法

    公开(公告)号:CN101356541B

    公开(公告)日:2012-05-30

    申请号:CN200680050931.6

    申请日:2006-01-13

    CPC classification number: G06K9/2054 G06K9/72 G06K2209/01

    Abstract: 自动提取关键字。当输入扫描的帐票图像时,布局识别单元(11)提取帐票图像的读取区域,字符识别单元(13)对该读取区域进行字符识别。在帐票逻辑定义体数据库(14)中存储根据相同种类的帐票中共同的逻辑结构而定义了构成关键字的字符串的帐票逻辑定义体。字符串候选提取单元(15)将字符识别出的字符满足已定义的字符串关系的组合作为字符串候选提取。并且,对应单元(16)将字符串候选根据位置关系进行对应,确定构成关键字的字符串候选的组合。

    逻辑结构模型创建辅助设备和方法

    公开(公告)号:CN101452443B

    公开(公告)日:2011-11-23

    申请号:CN200810180800.0

    申请日:2008-12-05

    CPC classification number: G06F17/243

    Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。

    布局分析设备和布局分析方法

    公开(公告)号:CN100568263C

    公开(公告)日:2009-12-09

    申请号:CN200610074795.6

    申请日:2006-04-14

    CPC classification number: G06K9/00463

    Abstract: 布局分析设备和布局分析方法。本发明涉及能够高度准确地从图像(如果该图像为彩色图像)中提取文本块的布局分析设备、布局分析方法。布局分析方法包括:分割区域提取步骤,根据二值图像提取通过图案划分的区域,以使用该提取结果作为分割区域;字符要素集合提取步骤,针对各分割区域,对通过第一二值图像布局分析处理提取的字符要素集合进行提取,以使用该提取结果作为字符要素集合;文本块提取步骤,在各分割区域中提取包含有所提取的字符要素集合的区域,以避免与第二二值图像布局处理所提取的非字符要素交叠,并使用该提取结果作为文本块;以及布局信息生成步骤,根据所述文本块以及第二二值图像布局分析处理所提取的非字符要素,生成布局信息。

    逻辑结构模型创建辅助设备和方法,用于其的记录介质

    公开(公告)号:CN101452443A

    公开(公告)日:2009-06-10

    申请号:CN200810180800.0

    申请日:2008-12-05

    CPC classification number: G06F17/243

    Abstract: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。

    采用概率密度函数的模式识别装置及其方法

    公开(公告)号:CN100416589C

    公开(公告)日:2008-09-03

    申请号:CN01137032.7

    申请日:2001-10-19

    Inventor: 武部浩明

    CPC classification number: G06K9/6278 G06K9/6828

    Abstract: 通过计算某模式集中各模式的特征向量与各标准类的平均向量之间的差,生成一差向量集。当输入未知模式的特征向量时,利用与差向量对应的误差分布作为概率密度函数,得到某类的概率密度函数的期望值,随后,基于所得期望值,确定该类的判别函数值,使该模式得以识别。

Patent Agency Ranking