-
公开(公告)号:CN101645134B
公开(公告)日:2013-01-02
申请号:CN200910002280.9
申请日:2005-07-29
Applicant: 富士通株式会社
Abstract: 本发明涉及整体地名识别方法和整体地名识别装置。该整体地名识别方法包括用于识别含有某一行政级别地名的地名图像中的地名的整体识别步骤,所述整体识别步骤包括:提取步骤,提取所述地名图像的特征向量;匹配步骤,将所提取的特征向量与地名字典中的地名的特征向量相匹配,寻找所有可能候选地名;其特征在于,当所述地名字典中的地名的特征向量与所提取的特征向量的匹配距离小于预定阈值时就将该地名判断为可能候选地名。
-
公开(公告)号:CN101520783B
公开(公告)日:2011-12-21
申请号:CN200810080943.4
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 本发明提供了一种基于图像内容的关键词搜索方法和装置。该关键词搜索装置在所输入的文档图像中搜索并定位所输入的关键词,该关键词搜索装置包括:整体匹配单元,该整体匹配单元从所述文档图像中提取多个候选关键词图像区域,提取所述多个候选关键词图像区域的图像特征,将所述图像特征与所述关键词的特征进行匹配,以获得与所述多个候选关键词图像区域相对应的匹配距离;校验单元,该校验单元对匹配距离小的前N个候选关键词图像区域进行识别,计算识别候选和所述关键词之间的校验距离;过滤单元,该过滤单元计算所述匹配距离和所述校验距离的组合距离,并根据该组合距离滤除组合距离大的候选关键词图像区域。
-
公开(公告)号:CN100555308C
公开(公告)日:2009-10-28
申请号:CN200510089537.0
申请日:2005-07-29
Applicant: 富士通株式会社
Abstract: 本发明公开的一种地址识别方法包括字符分割步骤、关键字符提取步骤、地名整体识别步骤、地址确定步骤,其中,所述关键字符提取步骤用于从多个单字符区域中提取关键字符,其中,所述关键字符提取步骤对所述多个单字符区域中的每个单字符区域进行的操作包括如下步骤:提取特征向量的步骤,提取所述单字符区域所对应的图像的特征向量;匹配步骤,将所提取的特征向量与只包括所有可能关键字符的关键字符字典中的关键字符的特征向量逐一匹配,寻找所有可能候选关键字符。
-
公开(公告)号:CN115049869A
公开(公告)日:2022-09-13
申请号:CN202110256627.3
申请日:2021-03-09
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种图像分类方法和装置,参数训练方法,该图像分类方法包括:将输入图像数据输入分类器中,提取输入图像数据的特征向量,根据该特征向量对该输入图像数据进行分类,得到各输入图像数据对应的预测标签,并确定第一损失函数;该标签表示该输入图像数据所属的类别;该输入图像数据包括源域图像数据和目标域图像数据;判别器根据该特征向量的梯度判别该梯度对应的预测域标签是源域或目标域,并确定第二损失函数;根据该第一损失函数和该第二损失函数,训练并更新该分类器和该判别器的参数,直至该第一损失函数和该第二损失函数最优化;参数更新后的所述分类器对需要分类的输入图像数据进行分类,以得到所述需要分类的输入图像数据的分类结果。
-
公开(公告)号:CN101256631B
公开(公告)日:2011-06-01
申请号:CN200710078767.6
申请日:2007-02-26
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高系统的识别精度。
-
公开(公告)号:CN101256631A
公开(公告)日:2008-09-03
申请号:CN200710078767.6
申请日:2007-02-26
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高系统的识别精度。
-
公开(公告)号:CN101276327A
公开(公告)日:2008-10-01
申请号:CN200710091539.2
申请日:2007-03-27
Applicant: 富士通株式会社
Abstract: 本发明公开了地址识别装置。所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
-
公开(公告)号:CN1904906A
公开(公告)日:2007-01-31
申请号:CN200510089537.0
申请日:2005-07-29
Applicant: 富士通株式会社
Abstract: 地址识别装置和方法。本发明公开的一种地址识别方法包括字符分割步骤、关键字符提取步骤、地名整体识别步骤、地址确定步骤,其中,所述关键字符提取步骤用于从多个单字符区域中提取关键字符,其中,所述关键字符提取步骤对所述多个单字符区域中的每个单字符区域进行的操作包括如下步骤:提取特征向量的步骤,提取所述单字符区域所对应的图像的特征向量;匹配步骤,将所提取的特征向量与只包括所有可能关键字符的关键字符字典中的关键字符的特征向量逐一匹配,寻找所有可能候选关键字符。
-
公开(公告)号:CN107563401A
公开(公告)日:2018-01-09
申请号:CN201710123864.6
申请日:2017-03-03
IPC: G06K9/62
Abstract: 本发明公开一种融合分类和聚类的集成分类识别方法,包括以下步骤:针对若干个待分类的样本,设定至少一个分类模型和至少一个聚类模型;获得每个样品属于每个分类组的次数,获得每个样品属于每个聚类模型的聚类组的次数,形成样本-组共现矩阵;根据样本-组共现矩阵依次计算若干个待分类的样本中两两样本的聚类相似度,形成样本聚类相似图矩阵;基于样本聚类归一化相似图矩阵W和样本分类概率矩阵耦合了聚类归一化相似图矩阵和样本分类概率矩阵信息,从而获得修正后样本分类概率矩阵。本发明融合分类和聚类的集成分类识别方法虑融合聚类模型或分类模型,大大提高了分类结果的精度,从而在实际中取得更好的结果。
-
公开(公告)号:CN101373519B
公开(公告)日:2011-01-19
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
-
-
-
-
-
-
-
-