-
公开(公告)号:CN102855264B
公开(公告)日:2015-11-25
申请号:CN201110192577.3
申请日:2011-07-01
Applicant: 富士通株式会社
Abstract: 本申请涉及文档处理方法及其装置,其中对于多个输入的文档图像中的每个文档图像:检测与初始关键字符相匹配的初始关键字符图像,所述初始关键字符是所述多个文档图像的标题中的关键字符;针对每个初始关键字符图像,提取与该初始关键字符图像相邻的至少一个字符图像作为相邻字符图像,其中初始关键字符图像与相邻字符图像构成准标题区域;计算每个准标题区域的置信度值,并且选择具有最高置信度值的准标题区域作为该文档图像的标题候选,其中所述准标题区域的置信度值表示相应的准标题图像是该文档图像的标题的可能性;基于从所述多个文档图像获得的标题候选对文档图像进行聚类,从而得到具有同类标题的文档分类。
-
公开(公告)号:CN102779140B
公开(公告)日:2015-09-02
申请号:CN201110128161.5
申请日:2011-05-13
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30253 , G06K9/2054 , G06K2209/01
Abstract: 本发明实施例公开了一种关键词获取方法,包括:定位图像中的文字区域,并利用OCR技术识别出所述文字区域中的文字内容;从所识别出的文字内容中,选择第一类待定关键词进行网页搜索;在搜索到的网页中提取第二类待定关键词;以及至少根据所述第二类待定关键词确定所述图像对应的关键词。通过本发明实施例将OCR技术与网页搜索的技术相结合,基于根据OCR技术识别及选择出的第一类待定关键词进行网页搜索,保证了关键词的收敛性,然后基于搜索到的网页选择第二类待定关键词保证了关键词的正确性,从而提高了最终确定的图像对应的关键词的精确度。
-
公开(公告)号:CN104794527A
公开(公告)日:2015-07-22
申请号:CN201410024775.2
申请日:2014-01-20
Applicant: 富士通株式会社
IPC: G06N3/08
Abstract: 公开了一种基于卷积神经网络的分类模型构建方法和设备,该方法包括:卷积步骤,以随机卷积方式对训练样本进行第一阶段训练,以得到用于卷积操作的卷积模板值,从而构建包括卷积模板值的分类模型,其中,以随机卷积方式对训练样本进行第一阶段训练进一步包括:对于至少一个当前卷积层,基于预定概率阈值以随机方式打断当前卷积层的特征图中的元素与和当前卷积层相邻的上一层的特征图中的元素之间的连接。根据本公开,可以减少训练样本时使用的权值数量,减轻过拟合问题,从而提高卷积神经网络的泛化能力。
-
公开(公告)号:CN104680165A
公开(公告)日:2015-06-03
申请号:CN201310616078.1
申请日:2013-11-27
Applicant: 富士通株式会社
Abstract: 本发明涉及从场景图像中自动提取路牌图像的方法和装置。从场景图像中自动提取路牌图像的方法包括:从场景图像中识别至少一个标志字符;根据包含至少一个标志字符的标志字符图像区域来估计标志字符颜色和路牌图像的路牌背景颜色;根据标志字符颜色和路牌背景颜色对场景图像进行多值化,以得到标志字符颜色被分为同一类别、路牌背景颜色被分为同一类别且其他颜色被分为同一类别的多值化场景图像;以及根据多值化场景图像中的围绕至少一个标志字符的且颜色属于路牌背景颜色的那一类别的连通域来提取路牌图像。
-
公开(公告)号:CN104573683A
公开(公告)日:2015-04-29
申请号:CN201310495142.5
申请日:2013-10-21
Applicant: 富士通株式会社
CPC classification number: G06K9/2054
Abstract: 本发明涉及一种字符串识别方法和装置。一种字符串识别方法,包括:将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。通过本发明,可以简化切分识别候选网格,加速路径搜索过程。
-
公开(公告)号:CN104184918A
公开(公告)日:2014-12-03
申请号:CN201310201320.9
申请日:2013-05-27
Applicant: 富士通株式会社
Abstract: 本发明涉及一种图像处理装置、一种图像处理方法以及一种包括该图像处理装置的上置式图像扫描装置。根据本发明的图像处理装置包括:参考线确定单元,用于在待处理图像中确定参考线,该参考线用于协助提取图像中前景对象的边缘;以及干扰边缘识别单元,用于根据参考线确定单元确定的参考线来识别图像中存在的干扰边缘,其中干扰边缘是由图像中的背景对象造成的、对图像中的前景对象的边缘提取造成干扰的边缘。
-
公开(公告)号:CN104123712A
公开(公告)日:2014-10-29
申请号:CN201310149461.0
申请日:2013-04-26
Applicant: 富士通株式会社
IPC: G06T7/00
Abstract: 本申请公开了一种相似度计算装置和方法与对象识别设备和方法,该相似度计算装置包括:存储单元,被配置为存储针对检测对象的各个预定模板;匹配单元,被配置为使用存储单元中存储的预定模板与输入图像的边缘图进行匹配,针对预定模板中的每个边缘点获取在边缘图中距该边缘点最近的最近边缘点;距离计算单元,被配置为根据边缘点和最近边缘点的相对位置关系,在边缘点和最近边缘点中的一个的邻域中选择第二边缘点,并计算边缘点和最近边缘点中的另一个与第二边缘点之间的距离作为边缘点与最近边缘点的距离;以及相似度计算单元,被配置为基于预定模板中的每个边缘点的距离确定输入图像与预定模板的相似度。
-
-
公开(公告)号:CN103714094A
公开(公告)日:2014-04-09
申请号:CN201210380709.X
申请日:2012-10-09
Applicant: 富士通株式会社
CPC classification number: G06F17/30796 , G06K9/6267
Abstract: 本发明公开了一种识别视频中的对象的设备和方法。所述设备包括:对象特征提取装置,被配置为从视频中提取候选对象,并提取候选对象的特征;文本信息处理装置,被配置为提取视频中包含的文本信息,并且利用关键字数据库对所述文本信息进行过滤以得到与所述候选对象相关的过滤文本;在线图像搜索装置,被配置为在线搜索与过滤文本对应的图像,并提取图像的特征;匹配器,被配置为匹配候选对象的特征和图像的特征,并基于匹配结果确定候选对象或者过滤文本,或者同时确定二者。
-
公开(公告)号:CN103455995A
公开(公告)日:2013-12-18
申请号:CN201210177619.0
申请日:2012-05-31
Applicant: 富士通株式会社
IPC: G06T7/00
CPC classification number: G06K9/00463 , G06K9/32 , G06K9/4638 , G06K2009/485 , G06K2209/01 , G06T5/002 , G06T5/40 , G06T7/12 , G06T7/181 , G06T2207/10008 , G06T2207/20192 , G06T2207/30176
Abstract: 提供一种图像处理装置、图像处理方法、扫描仪和存储介质。该图像处理装置用于跟踪图像中对象图像的边界,该边界连续且相邻点斜率变化平缓。该图像处理装置包括:边界估计单元,用于估计对象图像的边界的位置;干扰梯度处理单元,用于对图像中所估计边界附近的干扰梯度进行处理,以减弱或从图像中去除干扰梯度;边界跟踪单元,用于针对已处理干扰梯度的图像跟踪边界。采用本公开的技术,图像边界跟踪的准确性显著提高。
-
-
-
-
-
-
-
-
-