-
公开(公告)号:CN103383732B
公开(公告)日:2016-12-14
申请号:CN201210137925.1
申请日:2012-05-04
Applicant: 富士通株式会社
CPC classification number: G06T7/004 , G06K9/00442 , G06T7/70
Abstract: 提供了一种图像处理方法和装置。该方法包括:生成图像的第一尺度二值图,第一尺度小于图像原始尺度;基于第一尺度的二值图检测图像中的至少一个文本行;生成图像的第二尺度二值图,其中第二尺度大于第一尺度;针对每个文本行,计算第一尺度二值图中相应部分与第二尺度二值图中相应部分间的相似度,并将相似度低于预定水平的文本行作为噪声去除;针对未去除的文本行中的一个或更多个,对第二尺度的二值图中的相应部分进行OCR以确定相应文本行的文字取向;以及根据所确定的文字取向确定图像的取向。检测文本行的步骤包括检测水平文本行和竖直文本行,在其重叠的情况下检测重叠区域的文本块取向,并将与文本块取向不一致的文本行作为噪声去除。
-
公开(公告)号:CN102779140B
公开(公告)日:2015-09-02
申请号:CN201110128161.5
申请日:2011-05-13
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30253 , G06K9/2054 , G06K2209/01
Abstract: 本发明实施例公开了一种关键词获取方法,包括:定位图像中的文字区域,并利用OCR技术识别出所述文字区域中的文字内容;从所识别出的文字内容中,选择第一类待定关键词进行网页搜索;在搜索到的网页中提取第二类待定关键词;以及至少根据所述第二类待定关键词确定所述图像对应的关键词。通过本发明实施例将OCR技术与网页搜索的技术相结合,基于根据OCR技术识别及选择出的第一类待定关键词进行网页搜索,保证了关键词的收敛性,然后基于搜索到的网页选择第二类待定关键词保证了关键词的正确性,从而提高了最终确定的图像对应的关键词的精确度。
-
公开(公告)号:CN102831579B
公开(公告)日:2015-06-17
申请号:CN201110172095.1
申请日:2011-06-16
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了文本增强方法及装置、文本提取方法及装置,所述文本增强方法包括:获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到原始图像的滤波后的更新亮度值或/和颜色值,邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与原始图像对应的文本增强图像。通过本发明实施例,可以增强原始图像中包括的文本,以使后续针对该文本增强图像进行的文本提取更为精确和准确。
-
公开(公告)号:CN103377377A
公开(公告)日:2013-10-30
申请号:CN201210110613.1
申请日:2012-04-16
Applicant: 富士通株式会社
Abstract: 提供了一种用于生成字符分类器的训练样本的方法和装置。该方法包括步骤:获得多个字符的二值样本图;以及针对二值样本图中的每个,识别该二值样本图中的连通部件;通过去除连通部件中面积低于预定标准的一个或更多个连通部件来生成新的二值样本图;以及将所生成的二值样本图添加为相应字符的训练样本。
-
-
公开(公告)号:CN103544186A
公开(公告)日:2014-01-29
申请号:CN201210246688.2
申请日:2012-07-16
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/5846 , G06K9/6814
Abstract: 本发明涉及一种挖掘图片中的主题关键词的方法和设备。挖掘图片中的主题关键词的方法包括:初始检索词识别步骤,识别图片中的关键词作为初始的检索词;候选关键词提取步骤,利用检索词检索与图片相关的主题网页以从中提取候选关键词;检索词选择步骤,根据候选关键词和搜索候选关键词所用的检索词之间的链接关系,从候选关键词中选择一部分候选关键词作为下次的候选关键词提取步骤所用的检索词;以及重复候选关键词提取步骤和检索词选择步骤直到满足预定条件。
-
-
-
-
-