-
公开(公告)号:CN105989341A
公开(公告)日:2016-10-05
申请号:CN201510086612.1
申请日:2015-02-17
Applicant: 富士通株式会社
Abstract: 本发明公开了一种文字识别方法和装置。根据本发明的一个方面,文字识别方法包括:从包含文字的图像中提取多个连通部件;对所述多个连通部件进行分类,以生成第一语言连通部件和/或非第一语言连通部件;将所述第一语言连通部件聚类为第一语言文本行,并将所述非第一语言连通部件聚类为非第一语言文本行;以及从所述第一语言文本行和所述非第一语言文本行中识别出第一语言文字和非第一语言文字。
-
公开(公告)号:CN105844207A
公开(公告)日:2016-08-10
申请号:CN201510021514.X
申请日:2015-01-15
Applicant: 富士通株式会社
Abstract: 本发明公开了文本行提取方法和文本行提取设备。根据本发明的文本行提取方法包括:提取输入文档图像中的连通域;确定连通域之间的潜在链接;调整潜在链接构成的生成树;以及基于调整后的生成树,优化与生成树对应的文本行,使得文本行中字符的总差异最小。根据本发明的文本行提取方法和文本行提取设备能够准确地、鲁棒地提取出文档图像中的文本行。
-
公开(公告)号:CN105719243A
公开(公告)日:2016-06-29
申请号:CN201410734194.8
申请日:2014-12-04
Applicant: 富士通株式会社
CPC classification number: G06T7/0081 , G06K9/4647 , G06K2209/01 , G06T5/005 , G06T7/11 , G06T7/194 , G06T11/60 , G06T2207/10024 , G06T2207/30176
Abstract: 本公开涉及图像处理装置和方法,图像处理装置包括:图像获取单元,其获取包含像素的图像;图片查找单元,其从图像中查找图片区域;背景获取单元,其在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域;前景获取单元,其分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域;以及合并单元,其将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域。本公开可以更有效地提取文档前景区域。
-
公开(公告)号:CN105678207A
公开(公告)日:2016-06-15
申请号:CN201410665944.0
申请日:2014-11-19
Applicant: 富士通株式会社
IPC: G06K9/00
Abstract: 本发明涉及一种用于从给定图像中识别目标铭板图像的内容的装置和方法。所述装置包括:候选铭板图像获取模块,其被配置成从给定图像中获取所述目标铭板图像的一个或多个候选铭板图像;目标铭板图像确定模块,其被配置成利用预先定义的所述目标铭板图像的布局,检测每个候选铭板图像,从而确定目标铭板图像以及目标铭板图像的内容的位置,所述布局包括:文本行的数量、每个文本行的属性、文本行之间的相对位置;及识别模块,其被配置成识别所述目标铭板图像的内容。根据本发明,能够更快速、准确地从给定图像中识别目标铭板图像的内容。
-
-
公开(公告)号:CN105447566A
公开(公告)日:2016-03-30
申请号:CN201410239699.7
申请日:2014-05-30
Applicant: 富士通株式会社
IPC: G06N3/08
Abstract: 本公开提供了训练装置、训练方法以及检测装置。一种用于对卷积神经网络模型进行训练的装置包括特征获取及竞争单元以及模型训练单元。特征获取及竞争单元包括:获取子单元,被配置成针对所述卷积神经网络模型的至少一个卷积层、获取训练样本数据的至少两个不同方面的特征;以及竞争子单元,被配置成基于所述获取子单元获取的至少两个不同方面的特征的对应元素,选择每个元素位置处的最优元素,以得到竞争结果特征。模型训练单元被配置成在训练卷积神经网络模型的过程中,针对所述至少一个卷积层,应用所述竞争结果特征来执行训练。
-
公开(公告)号:CN105335948A
公开(公告)日:2016-02-17
申请号:CN201410389424.1
申请日:2014-08-08
Applicant: 富士通株式会社
IPC: G06T5/50
Abstract: 本发明实施例提供一种文档图像的拼接装置、方法以及扫描仪,其中,该装置包括:校正单元,用于对各个待拼接的文档图像进行初步校正;检测单元,用于检测所述校正单元初步校正后的各个待拼接的文档图像的最优拼缝,其中,所述最优拼缝穿过所述文档图像的空白区域,并且沿着所述最优拼缝的仿射场的变化最小;拼接单元,用于根据所述检测单元检测出的最优拼缝,对各个待拼接的文档图像进行拼接。由于在检测最优拼缝时同时考虑了穿过文档空白区域和仿射场稳定这两个因素,能够获得完整的且内容正确的拼接图像。
-
公开(公告)号:CN105205448A
公开(公告)日:2015-12-30
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/00536 , G06K9/6267 , G06K2209/01
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN105096348A
公开(公告)日:2015-11-25
申请号:CN201410183248.6
申请日:2014-04-30
Applicant: 富士通株式会社
CPC classification number: G06T7/168 , G06K9/4604 , G06K9/4652 , G06K9/4671 , G06K2009/4657 , G06T5/007 , G06T7/11 , G06T7/73 , G06T7/90 , G06T2200/12 , G06T2207/10004 , G06T2207/10024 , G06T2207/20048 , G06T2207/30168
Abstract: 本发明实施例提供一种检测图像中的色彩板的装置和方法,其中,所述装置包括:提取单元,其使用预定滑窗从输入图像上提取多个位置的滑窗的滑窗特征;选择单元,其使用预定的多个滑窗模板,从所述多个位置的滑窗中寻找与每一个滑窗模板距离最小的滑窗,作为所述滑窗模板的匹配滑窗;确定单元,其根据每一个滑窗模板的匹配结果,确定所述输入图像上的色彩板的色块的分割线。通过本发明实施例的方法和装置,基于单独RGB通道特征以及色彩板几何结构即可自动检测出图像中的色彩板,与其它方法相比,具有更快的速度和更好的鲁棒性。
-
公开(公告)号:CN104794527A
公开(公告)日:2015-07-22
申请号:CN201410024775.2
申请日:2014-01-20
Applicant: 富士通株式会社
IPC: G06N3/08
Abstract: 公开了一种基于卷积神经网络的分类模型构建方法和设备,该方法包括:卷积步骤,以随机卷积方式对训练样本进行第一阶段训练,以得到用于卷积操作的卷积模板值,从而构建包括卷积模板值的分类模型,其中,以随机卷积方式对训练样本进行第一阶段训练进一步包括:对于至少一个当前卷积层,基于预定概率阈值以随机方式打断当前卷积层的特征图中的元素与和当前卷积层相邻的上一层的特征图中的元素之间的连接。根据本公开,可以减少训练样本时使用的权值数量,减轻过拟合问题,从而提高卷积神经网络的泛化能力。
-
-
-
-
-
-
-
-
-