文档图像的检索装置及文档图像的检索方法

    公开(公告)号:CN101276363A

    公开(公告)日:2008-10-01

    申请号:CN200710090670.7

    申请日:2007-03-30

    CPC classification number: G06K9/4604 G06K9/00456 G06K2209/01

    Abstract: 本发明提供一种可提高以文字和图表为主要内容的文档图像的检索精度的文档图像的检索装置及检索方法。本发明的文档图像的检索装置在图像的特征区段的信息中包含有用于图像彼此之间的识别中的特征矢量。具体地讲,将文档图像页中的文字部分连结,而抽出矩形图像,基于该矩形图像的信息,分析页的几何构造,并将文档图像页分割成多个区段,且从其中选择表现文档图像页的特征的多个特征区段,由所选择的这些特征区段的信息构成特征矢量。

    文档图像处理装置以及文档图像处理方法

    公开(公告)号:CN101226595A

    公开(公告)日:2008-07-23

    申请号:CN200710000960.8

    申请日:2007-01-15

    CPC classification number: G06K9/6828 G06F17/30253

    Abstract: 本发明的文档图像处理装置,抽取出文档图像中的标题区域的图像,将其按单个文字进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。然后,基于所制作出的索引矩阵,制作出反映了文档图像内容的有意义的文档名,并对所存储的文档图像进行管理。由此,可以提供一种不用麻烦用户的手,就可自动制作反映了文档图像内容的有意义的文档名并进行管理的文档图像处理装置及方法。

    一种文本检测的方法和装置

    公开(公告)号:CN105718926A

    公开(公告)日:2016-06-29

    申请号:CN201410724574.3

    申请日:2014-12-03

    Inventor: 江淑红 吴波

    CPC classification number: G06K9/20

    Abstract: 本发明提供了一种计算估计笔画宽度ESW的方法,包括以下步骤:根据二值化图像,获取笔画边缘信息;计算每个笔画边缘像素点在不少于四个取向上的笔画宽度,所述每个笔画边缘像素点在不少于四个取向上的笔画宽度是所述笔画边缘像素点到位于由所述笔画边缘像素点和所述取向决定的直线上的另一笔画边缘像素点的距离;将计算得到的每个笔画边缘像素点在不少于四个取向上的笔画宽度分别与经过该笔画边缘像素点并沿着该取向上的每个笔画内像素点相关联;以及针对每个笔画内像素点,选择与所述笔画内像素点相关联的多个笔画宽度的最小值作为所述笔画内像素点的估计笔画宽度ESW。本发明还提供了与该方法相对应的装置。

    手写识别方法和设备
    34.
    发明公开

    公开(公告)号:CN105095924A

    公开(公告)日:2015-11-25

    申请号:CN201410171650.2

    申请日:2014-04-25

    Inventor: 江淑红 吴波

    CPC classification number: G06K9/62

    Abstract: 本申请公开了一种手写识别方法以及相应的手写识别设备。所述方法包括:接收用户在同一输入区域连续输入的手写笔画序列;以及基于单字可信度,对所接收的手写笔画序列进行切分断字。所公开的手写识别方法以及相应的手写识别设备不但能够识别用户在同一输入区域内以重叠覆盖的方式连续输入的多个字符,还能保障较高的切分断字精度和手写输入效率。

    手写字符识别方法和系统
    35.
    发明公开

    公开(公告)号:CN104680196A

    公开(公告)日:2015-06-03

    申请号:CN201310616121.4

    申请日:2013-11-27

    Inventor: 江淑红 吴波

    CPC classification number: G06K9/00429 G06K9/72 G06K2209/013

    Abstract: 本发明涉及一种手写字符识别方法和系统,其可以在输入字符的一部分笔画之后就识别所要输入的字符。根据该手写字符识别方法,首先接收用户输入的手写轨迹,然后将手写轨迹与笔画模板进行匹配,确定匹配度。最后,按照匹配度来输出与匹配的笔画模板相对应的标准字符。其中,笔画模板包括字符的完整笔画模板和不完整笔画模板,不完整笔画模板所对应的不完整笔画字符不构成其他任何字符的部分或全部。该方法易于实现,并且具有很好的应用前景。其可以用于在各种电子设备中利用触摸板来输入复杂的手写字符的情况下,以节省工作量并提高输入效率。

    对数据进行聚类的方法、设备和系统

    公开(公告)号:CN101833553B

    公开(公告)日:2013-09-11

    申请号:CN200910126215.7

    申请日:2009-03-09

    Abstract: 本发明公开了一种对数据进行聚类的方法、设备和系统。首先创建分级生成树,然后进行迭代图缩减和约束图切分;并且最后实现了分级式分割。通过分割的子图来获得聚类结果。本发明的计算成本低,处理速度快,聚类精度高,并且鲁棒性强。聚类的结果具有较好的统计特征。本发明可以用于各种数据分类系统。

    文字图像抽出装置及文字图像抽出方法

    公开(公告)号:CN101354746B

    公开(公告)日:2011-08-31

    申请号:CN200710129605.0

    申请日:2007-07-23

    CPC classification number: G06K9/34 G06K9/342 G06K9/348 G06K2209/01

    Abstract: 本发明提供一种文字图像抽出方法及文字图像抽出装置。在抽出步骤中,通过抽出部(401),对排列两个或两个以上文字的文字列区域,求出由相互连接的两个或两个以上像素构成的连接成分,并从其中抽出由与连接成分外接的外接图形划分的划分要素。在改变步骤中,通过第一改变部(402),在上述抽出的划分要素中,将至少一部分相互重合的划分要素进行综合而作为新的划分要素。在下面的第一选择步骤中,通过第一选择部(403),预先确定基准大小,在第一改变步骤中改变的划分要素中,选择比上述基准大小还大的划分要素。之后,可以按该顺序执行第二改变步骤及第二选择步骤。由此,可以从排列两个或两个以上文字的文字列区域中高精度地抽出各文字的图像。

    图像检索装置及图像检索方法

    公开(公告)号:CN101488129B

    公开(公告)日:2011-04-13

    申请号:CN200810000707.7

    申请日:2008-01-14

    CPC classification number: G06K9/4647

    Abstract: 本发明提供一种图像检索装置及图像检索方法。若在灰度处理部(11)中转换成灰度图像数据,则直方图生成部(12)生成表示上述灰度图像数据的像素数分布的直方图。基于关注像素的浓淡度和以大致圆周状地包围关注像素的多个周边像素的浓淡度,针对各像素计算出旋转不变的特征量,并基于所计算出的特征量生成直方图,其中该旋转不变的特征量表示以关注像素为中心的局部的纹理特征。检索部(15),基于登记图像数据的直方图和输入图像数据的直方图,检索相似的图像数据,显示部(16)显示检索结果。

    对数据进行聚类的方法、设备和系统

    公开(公告)号:CN101833553A

    公开(公告)日:2010-09-15

    申请号:CN200910126215.7

    申请日:2009-03-09

    Abstract: 公开了一种对数据进行聚类的方法、设备和系统。首先创建分级生成树,然后进行迭代图缩减和约束图切分;并且最后实现了分级式分割。通过分割的子图来获得聚类结果。本发明的计算成本低,处理速度快,聚类精度高,并且鲁棒性强。聚类的结果具有较好的统计特征。本发明可以用于各种数据分类系统。

    图像辨别装置及图像检索装置

    公开(公告)号:CN101567048A

    公开(公告)日:2009-10-28

    申请号:CN200810090491.8

    申请日:2008-04-21

    CPC classification number: G06K9/54 G06K9/346 G06K9/522

    Abstract: 本发明提供能够降低辨别处理所需的运算量且能够提高辨别精度的图像辨别装置及具备该装置的图像检索装置。其中,预处理部(120)对所输入的图像数据进行二值化并算出全体黑像素比例。在特征抽出部(121)中,检测出二值图像数据中包含的连通区域,检测出外接于该连通区域的外接矩形。对检测出的外接矩形,基于外接矩形的大小及所包含的黑像素数,从所有连通区域中去除规定的连通区域。辨别部(122)利用剩余的连通区域生成边缘图,并进行二维快速傅立叶变换而生成频谱数据。另一方面,也对模板图像进行二维快速傅立叶变换而生成频谱数据,并基于这些频谱数据来辨别输入图像数据中是否包含圆形状。

Patent Agency Ranking