信息处理装置和信息处理方法

    公开(公告)号:CN103377199B

    公开(公告)日:2016-06-29

    申请号:CN201210112493.9

    申请日:2012-04-16

    Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。

    信息处理装置和信息处理方法

    公开(公告)号:CN103377199A

    公开(公告)日:2013-10-30

    申请号:CN201210112493.9

    申请日:2012-04-16

    Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。

    图像分类器生成方法和装置及图像分类方法和装置

    公开(公告)号:CN103679188A

    公开(公告)日:2014-03-26

    申请号:CN201210337846.5

    申请日:2012-09-12

    Inventor: 陈思源 何源 孙俊

    Abstract: 本发明提供一种图像分类器生成方法和装置及图像分类方法和装置。生成用于表单分拣设备的图像分类器的方法,包括:从多个样本图像中的每个样本图像中提取多个局部特征;将多个样本图像中的每个样本图像划分为多个子区域;将从多个样本图像中提取的多个局部特征中的至少与多个子区域中的同一子区域相关联的局部特征分为同一组;以及根据同一组中的局部特征生成与同一子区域对应的搜索树作为图像分类器。

    挖掘图片中的主题关键词的方法和设备

    公开(公告)号:CN103544186A

    公开(公告)日:2014-01-29

    申请号:CN201210246688.2

    申请日:2012-07-16

    CPC classification number: G06F16/5846 G06K9/6814

    Abstract: 本发明涉及一种挖掘图片中的主题关键词的方法和设备。挖掘图片中的主题关键词的方法包括:初始检索词识别步骤,识别图片中的关键词作为初始的检索词;候选关键词提取步骤,利用检索词检索与图片相关的主题网页以从中提取候选关键词;检索词选择步骤,根据候选关键词和搜索候选关键词所用的检索词之间的链接关系,从候选关键词中选择一部分候选关键词作为下次的候选关键词提取步骤所用的检索词;以及重复候选关键词提取步骤和检索词选择步骤直到满足预定条件。

    挖掘图片中的主题关键词的方法和设备

    公开(公告)号:CN103544186B

    公开(公告)日:2017-03-01

    申请号:CN201210246688.2

    申请日:2012-07-16

    Abstract: 本发明涉及一种挖掘图片中的主题关键词的方法和设备。挖掘图片中的主题关键词的方法包括:初始检索词识别步骤,识别图片中的关键词作为初始的检索词;候选关键词提取步骤,利用检索词检索与图片相关的主题网页以从中提取候选关键词;检索词选择步骤,根据候选关键词和搜索候选关键词所用的检索词之间的链接关系,从候选关键词中选择一部分候选关键词作为下次的候选关键词提取步骤所用的检索词;以及重复候选关键词提取步骤和检索词选择步骤直到满足预定条件。

    生成字符分类器的训练样本的方法和设备

    公开(公告)号:CN103377377A

    公开(公告)日:2013-10-30

    申请号:CN201210110613.1

    申请日:2012-04-16

    Abstract: 提供了一种用于生成字符分类器的训练样本的方法和装置。该方法包括步骤:获得多个字符的二值样本图;以及针对二值样本图中的每个,识别该二值样本图中的连通部件;通过去除连通部件中面积低于预定标准的一个或更多个连通部件来生成新的二值样本图;以及将所生成的二值样本图添加为相应字符的训练样本。

    识别图像中的字符串的方法和装置

    公开(公告)号:CN103310209A

    公开(公告)日:2013-09-18

    申请号:CN201210062124.3

    申请日:2012-03-09

    Abstract: 本发明涉及识别图像中的字符串的方法和装置。识别图像中的字符串的方法包括:提取图像中的字符串区域;对字符串区域进行过分割;以及基于语言类别上下文特征和字符占位宽度上下文特征中的至少一个特征利用路径搜索策略来识别字符串区域中包含的字符串。

Patent Agency Ranking