指定文本行提取方法和装置

    公开(公告)号:CN100514355C

    公开(公告)日:2009-07-15

    申请号:CN200510098628.0

    申请日:2005-09-05

    Abstract: 指定文本行提取方法和装置。本发明的在垂直方向上分离文本行图像的方法,包括:多行判断步骤,判断所述文本行图像是否包含多行文本;行间噪声去除步骤,在判断出所述文本行图像包含多行文本时,进行行间噪声去除。本发明还提供了一种提取指定文本行的方法。

    标题抽取设备及标题抽取方法

    公开(公告)号:CN1269068C

    公开(公告)日:2006-08-09

    申请号:CN01135943.9

    申请日:1996-09-04

    Inventor: 胜山裕 直井聪

    CPC classification number: G06K9/00469

    Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。

    灰度字符词典的生成装置
    78.
    发明公开

    公开(公告)号:CN1804869A

    公开(公告)日:2006-07-19

    申请号:CN200510000439.5

    申请日:2005-01-11

    CPC classification number: G06K9/6857 G06K9/6255 G06K2209/01

    Abstract: 一种灰度字符词典生成装置,包括:第一级合成灰度退化字符图像生成单元,用于利用输入于其中的各二值字符图像生成第一级合成灰度退化字符图像;聚类单元,用于将所述第一级合成灰度退化字符图像生成单元生成的每一类第一级合成灰度退化字符图像分为多个聚类;模板计算单元,用于为每一个所述聚类生成模板;转换矩阵计算单元,用于针对各模板生成转换矩阵;第二级合成灰度退化字符词典生成单元,利用所述转换矩阵获取每个聚类中的每个灰度退化字符的字符特征,构建各类合成灰度退化字符的特征空间,即第二级合成灰度字符词典。

    建立劣化字典的方法和装置

    公开(公告)号:CN1737824A

    公开(公告)日:2006-02-22

    申请号:CN200410058588.2

    申请日:2004-08-18

    CPC classification number: G06K9/6255

    Abstract: 本发明提供了一种自动建立劣化字典的装置和方法。其中,劣化模式生成模块根据不同的劣化参数,由原始字符图像生成多个劣化模式;劣化字典生成模块在这多个劣化模式的基础上建立与多个劣化参数对应的多个劣化字典;最后字典匹配模块根据测试样本组合,确定与该测试样本组合的劣化水平最为匹配的字典作为最终的劣化字典。在本发明中,通过简单的缩放处理和模糊处理来生成不同的劣化模式,由此建立劣化字典。因此,本发明可以简单容易地实现。本发明的方法和装置不仅可以用于字符识别领域,也可以用于语音识别和面容识别等其它领域。

    备注图像管理装置、备注图像管理系统和备注图像管理方法

    公开(公告)号:CN1226693C

    公开(公告)日:2005-11-09

    申请号:CN03145300.7

    申请日:2003-06-30

    CPC classification number: G06F17/30247

    Abstract: 本发明提供了一种适于管理和检索大量备注图像的备注图像管理装置、系统和方法。备注图像管理装置可连接到能够执行备注图像交换和备注图像显示的便携终端,该管理装置包括:适于管理备注图像的管理服务器和适于识别备注图像的字符信息的字符信息识别服务器。该管理服务器包括:备注图像累积部分,适于累积备注图像;和备注图像检索部分,适于从累积的备注图像中检索一预定备注图像以响应一请求。字符信息识别服务器包括适于从备注图像中识别字符信息的字符信息识别部分。

Patent Agency Ranking