-
公开(公告)号:CN101645134A
公开(公告)日:2010-02-10
申请号:CN200910002280.9
申请日:2005-07-29
Applicant: 富士通株式会社
Abstract: 本发明涉及整体地名识别方法和整体地名识别装置。该整体地名识别方法包括用于识别含有某一行政级别地名的地名图像中的地名的整体识别步骤,所述整体识别步骤包括:提取步骤,提取所述地名图像的特征向量;匹配步骤,将所提取的特征向量与地名字典中的地名的特征向量相匹配,寻找所有可能候选地名;其特征在于,当所述地名字典中的地名的特征向量与所提取的特征向量的匹配距离小于预定阈值时就将该地名判断为可能候选地名。
-
公开(公告)号:CN101520783A
公开(公告)日:2009-09-02
申请号:CN200810080943.4
申请日:2008-02-29
Applicant: 富士通株式会社
Abstract: 本发明提供了一种基于图像内容的关键词搜索方法和装置。该关键词搜索装置在所输入的文档图像中搜索并定位所输入的关键词,该关键词搜索装置包括:整体匹配单元,该整体匹配单元从所述文档图像中提取多个候选关键词图像区域,提取所述多个候选关键词图像区域的图像特征,将所述图像特征与所述关键词的特征进行匹配,以获得与所述多个候选关键词图像区域相对应的匹配距离;校验单元,该校验单元对匹配距离小的前N个候选关键词图像区域进行识别,计算识别候选和所述关键词之间的校验距离;过滤单元,该过滤单元计算所述匹配距离和所述校验距离的组合距离,并根据该组合距离滤除组合距离大的候选关键词图像区域。
-
公开(公告)号:CN116933147A
公开(公告)日:2023-10-24
申请号:CN202210324917.1
申请日:2022-03-30
IPC: G06F18/241 , G06F18/214 , G06N3/0464
Abstract: 本发明实施例提供一种对抗训练方法和装置,对抗训练装置包括:所述装置包括:生成单元,其用于将原始样本输入至神经网络模型中,生成对抗样本;提取单元,其利用所述神经网络模型提取与所述原始样本对应的第一特征向量和与所述对抗样本对应的第二特征向量;计算单元,其根据所述第一特征向量和所述第二特征向量计算第一特征偏移和第二特征偏移;确定单元,其根据所述第一特征偏移和所述第二特征偏移确定损失函数;第一训练单元,其根据所述损失函数,对所述神经网络模型进行对抗训练,直至所述损失函数最优化。
-
公开(公告)号:CN101359373B
公开(公告)日:2011-01-12
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
公开(公告)号:CN101276327B
公开(公告)日:2010-06-23
申请号:CN200710091539.2
申请日:2007-03-27
Applicant: 富士通株式会社
Abstract: 本发明公开了地址识别装置。所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
-
公开(公告)号:CN101373519A
公开(公告)日:2009-02-25
申请号:CN200710146535.X
申请日:2007-08-20
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN101359373A
公开(公告)日:2009-02-04
申请号:CN200710139913.1
申请日:2007-08-03
Applicant: 富士通株式会社
IPC: G06K9/72
Abstract: 本发明提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明能够大幅度提高对于退化字符图像的识别准确性。
-
-
-
-
-
-