用于确定词间距的方法和设备以及用于分词的方法和系统

    公开(公告)号:CN106156772B

    公开(公告)日:2019-08-02

    申请号:CN201510132285.9

    申请日:2015-03-25

    Inventor: 罗兆海 李献

    Abstract: 本公开涉及用于确定词间距的方法和设备以及用于分词的方法和系统。一种用于确定文档图像中的词间距的方法包括:划分步骤,将文档图像划分为文本图像块,然后将文本图像块划分为行图像区域,并且将每个行图像区域划分成字符或连通字符区域;第一获得步骤,对于至少一个行图像区域,通过聚类方法得到第一词间距阈值,由此,在至少一个行图像区域中的各间距之中,大于该第一词间距阈值的间距被称为初始词间距,小于或等于该第一词间距阈值的间距被称为初始字符间距;和调整步骤,根据该文档图像中的上下文信息,调整所述第一词间距阈值以获得第二词间距阈值,以便根据该第二词间距阈值来确定至少一个行图像区域中的最终词间距。

    确定平均字符宽度的方法和装置及字符切分方法和设备

    公开(公告)号:CN103093224A

    公开(公告)日:2013-05-08

    申请号:CN201110355148.3

    申请日:2011-11-08

    Inventor: 许梅芳 罗兆海

    Abstract: 本发明提供了确定平均字符宽度的方法和装置以及字符切分方法和设备。用于确定字符组的平均字符宽度的方法包括:得到字符组的第一平均字符宽度;通过置信度计算方法得到用于表示第一平均字符宽度与字符组的真实平均字符宽度的接近程度的第一平均字符宽度的置信度;以及根据第一平均字符宽度的置信度,确定字符组的平均字符宽度为第一平均字符宽度还是第二平均字符宽度。

    文档图像处理方法、文档图像处理装置及存储介质

    公开(公告)号:CN110321887A

    公开(公告)日:2019-10-11

    申请号:CN201810294456.1

    申请日:2018-03-30

    Inventor: 李娇凤 罗兆海

    Abstract: 本发明提供一种文档图像处理方法、文档图像处理装置及存储介质。所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。

    文本检测方法和装置以及文本信息提取方法和系统

    公开(公告)号:CN104182722B

    公开(公告)日:2018-05-18

    申请号:CN201310196300.7

    申请日:2013-05-24

    Inventor: 麻文华 罗兆海

    Abstract: 本公开涉及文本检测方法和装置以及文本信息提取方法和系统。提供了用于检测包括至少一个连通体(CC)的图像中的文本区域的方法。该方法包括:文本背景区域(TBR)检测步骤,用于从图像中检测至少一个TBR;CC过滤步骤,用于基于检测到的TBR对所述至少一个CC进行过滤以保留至少一个候选文本CC;和CC组合步骤,将所述至少一个候选文本CC进行组合以得到文本区域。根据本发明的方法可以快速地和/或精确地指出图像中的文本位置,从而改进文本检测的性能。

    文本检测方法和装置以及文本信息提取方法和系统

    公开(公告)号:CN104182722A

    公开(公告)日:2014-12-03

    申请号:CN201310196300.7

    申请日:2013-05-24

    Inventor: 麻文华 罗兆海

    Abstract: 本发明涉及文本检测方法和装置以及文本信息提取方法和系统。提供了用于检测包括至少一个连通体(CC)的图像中的文本区域的方法。该方法包括:文本背景区域(TBR)检测步骤,用于从图像中检测至少一个TBR;CC过滤步骤,用于基于检测到的TBR对所述至少一个CC进行过滤以保留至少一个候选文本CC;和CC组合步骤,将所述至少一个候选文本CC进行组合以得到文本区域。根据本发明的方法可以快速地和/或精确地指出图像中的文本位置,从而改进文本检测的性能。

    文字图像分行方法和装置以及文字图像识别方法和装置

    公开(公告)号:CN100492403C

    公开(公告)日:2009-05-27

    申请号:CN01140938.X

    申请日:2001-09-27

    Inventor: 罗兆海 李毅

    CPC classification number: G06K9/00463

    Abstract: 一种文字图像分行方法,包括以下步骤:分段步骤,将文字图像按像素分成一定宽度的并排的多个文字图像段;像素分布统计步骤,获得各个图像段的像素分布,即图像段的每个像素行中的黑色像素的数目,并获得整个图像的像素分布,即整个图像的每个像素行中的黑色像素的数目;段块形成步骤,根据像素分布统计步骤中获得的图像段的像素分布统计和整个图像的像素分布统计,将图像段拆分为段块;行图像形成步骤,用于将拆分的段块整理成行图像。根据该方法,提高了文字图像的行切分的准确性,特别是有一定噪声的文字图像的行切分的准确性,从而相应提高了文字图像的识别的准确性。

    文本检测方法和装置以及文本信息提取方法和系统

    公开(公告)号:CN104182744B

    公开(公告)日:2018-09-04

    申请号:CN201310196315.3

    申请日:2013-05-24

    Inventor: 麻文华 罗兆海

    Abstract: 本发明涉及一种文本检测方法和装置以及文本信息提取方法和系统。提供了一种用于检测包括至少一个连通体(CC)的图像中的文本区域的方法。该方法包括:文本背景区域检测(TBR)步骤,用于从所述图像中检测至少一个TBR;CC过滤步骤,用于对所述至少一个CC进行过滤以保留至少一个候选文本CC;和CC组合步骤,用于基于TBR检测步骤中检测出的TBR,组合所述至少一个候选文本CC以形成至少一个CC组,并且基于所述至少一个CC组生成至少一个文本区域。根据本发明的方法可以快速地和/或精确地指出图像中的文本位置,从而改进文本检测的性能。

    用于使具有透视畸变的图像去模糊的方法和装置

    公开(公告)号:CN103426144B

    公开(公告)日:2016-05-11

    申请号:CN201210154166.X

    申请日:2012-05-17

    Abstract: 本发明公开一种用于使具有透视畸变的图像去模糊的方法和装置。所述方法包括:透视信息检测步骤,用于检测图像的透视信息;子区域分割步骤,用于基于透视信息将图像分割成多个子区域,各子区域中的模糊度相同;以及去模糊步骤,用于使各子区域基于其模糊信息而去模糊。与现有技术相比,本发明可改善具有透视畸变的图像的去模糊效果。

    文档图像的语言判别方法和系统

    公开(公告)号:CN101593278B

    公开(公告)日:2013-01-16

    申请号:CN200810108571.1

    申请日:2008-05-27

    Inventor: 陈刚 罗兆海

    Abstract: 本发明提供一种文档图像的语言判别方法和系统。文档图像的语言判别方法包括:检测文档图像的文本块中的圆形白色像素连通域;和基于检测到的圆形白色像素连通域来确定该文本块是否是韩文。

    文档图像的语言判别方法和系统

    公开(公告)号:CN101593278A

    公开(公告)日:2009-12-02

    申请号:CN200810108571.1

    申请日:2008-05-27

    Inventor: 陈刚 罗兆海

    Abstract: 本发明提供一种文档图像的语言判别方法和系统。文档图像的语言判别方法包括:检测文档图像的文本块中的圆形白色像素连通域;和基于检测到的圆形白色像素连通域来确定该文本块是否是韩文。

Patent Agency Ranking