挖掘图片中的主题关键词的方法和设备

    公开(公告)号:CN103544186B

    公开(公告)日:2017-03-01

    申请号:CN201210246688.2

    申请日:2012-07-16

    Abstract: 本发明涉及一种挖掘图片中的主题关键词的方法和设备。挖掘图片中的主题关键词的方法包括:初始检索词识别步骤,识别图片中的关键词作为初始的检索词;候选关键词提取步骤,利用检索词检索与图片相关的主题网页以从中提取候选关键词;检索词选择步骤,根据候选关键词和搜索候选关键词所用的检索词之间的链接关系,从候选关键词中选择一部分候选关键词作为下次的候选关键词提取步骤所用的检索词;以及重复候选关键词提取步骤和检索词选择步骤直到满足预定条件。

    提取文档中的文本行的方法和装置

    公开(公告)号:CN105574530A

    公开(公告)日:2016-05-11

    申请号:CN201410525023.4

    申请日:2014-10-08

    Abstract: 本发明涉及提取文档中的文本行的方法和装置。根据本发明的一个方面,提供了一种提取文档中的文本行的方法,包括:对文档中的多个文本块进行粗聚类,以形成多个类;计算每个类的特征;根据每个类的特征,确定所述文档的方向;以及根据所述文档的方向对所述多个文本块进行精细聚类,以提取出文本行。

    数据处理方法和数据处理设备

    公开(公告)号:CN103678407A

    公开(公告)日:2014-03-26

    申请号:CN201210358626.0

    申请日:2012-09-24

    CPC classification number: G06F17/30253

    Abstract: 提供了一种数据处理方法和数据处理设备,该方法包括:图片识别步骤,用于对图片进行识别,以获得多个识别结果词,并根据特定组合形式从多个识别结果词生成一个或多个检索词;初始化步骤,用于对利用检索词进行检索而获得的网页进行初始化,以获得多个语句;主题相关性确定步骤,用于确定所获得的各个语句之间的主题相关性;主题段落划分步骤,用于基于所确定的主题相关性将多个语句划分为多个段落并确定各个段落的主题性值;以及主题段落选择步骤,用于基于确定的各段落的主题性值,从多个段落中选择满足预定条件的主题段落。根据本发明的实施例,能够高效准确地获取与图片相关的网页的主题段落并确定图片的主题,有利于信息检索、集成和共享。

    数据处理方法和设备
    5.
    发明公开

    公开(公告)号:CN103577414A

    公开(公告)日:2014-02-12

    申请号:CN201210254434.5

    申请日:2012-07-20

    CPC classification number: G06F16/951

    Abstract: 本发明公开了一种数据处理方法和设备,该方法包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用检索词进行搜索来获取网页并从网页中挖掘候选关键词;评级步骤,用于基于检索词和/或候选关键词与网页之间的链接关系,对检索词和/或候选关键词以及网页进行评级;以及检索词选择步骤,用于基于评级结果从候选关键词中选择网页和候选关键词获取步骤中下次所用的检索词,重复执行网页和候选关键词获取步骤、评级步骤和检索词选择步骤,直到满足预定条件。根据本发明实施例,可以提高数据处理效率,更准确地从图片挖掘主题关键词和主题网页,从而有利于向用户进行后续的扩展应用和服务推荐。

    数据过滤装置和方法,以及数据处理装置和方法

    公开(公告)号:CN103514195A

    公开(公告)日:2014-01-15

    申请号:CN201210212664.5

    申请日:2012-06-21

    CPC classification number: G06N99/005 G01S5/0252

    Abstract: 本发明提供了数据过滤装置和方法、数据处理装置和方法、无线定位设备和方法以及信息处理设备,以至少克服现有的数据过滤技术的处理精度和/或准确度低的问题。数据过滤装置包括:近邻集确定单元,其被配置用于确定待处理数据集中满足预定条件的数据子集中的每个数据的近邻集;计算单元,其被配置用于分别计算上述数据子集中的每个数据的近邻集中包含的数据量;以及过滤单元,其被配置用于基于上述数据子集中的每个数据的近邻集中包含的数据量,对上述数据子集中的数据进行过滤,以获得过滤后的数据集。数据过滤方法用于执行能够实现上述数据过滤装置的功能的处理。本发明的上述技术能够提高数据过滤的精度和/或准确度,可以用于数据处理领域。

    数据处理方法和设备
    8.
    发明授权

    公开(公告)号:CN103577414B

    公开(公告)日:2017-04-12

    申请号:CN201210254434.5

    申请日:2012-07-20

    Abstract: 公开了一种数据处理方法和设备,该方法包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用检索词进行搜索来获取网页并从网页中挖掘候选关键词;评级步骤,用于基于检索词和/或候选关键词与网页之间的链接关系,对检索词和/或候选关键词以及网页进行评级;以及检索词选择步骤,用于基于评级结果从候选关键词中选择网页和候选关键词获取步骤中下次所用的检索词,重复执行网页和候选关键词获取步骤、评级步骤和检索词选择步骤,直到满足预定条件。根据本发明实施例,可以提高数据处理效率,更准确地从图片挖掘主题关键词和主题网页,从而有利于向用户进行后续的扩展应用和服务推荐。

    无线定位方法和装置
    9.
    发明公开

    公开(公告)号:CN104080039A

    公开(公告)日:2014-10-01

    申请号:CN201310100399.6

    申请日:2013-03-26

    Abstract: 本发明涉及一种无线定位方法和装置。该无线定位方法用于根据移动设备的给定无线信号特征来确定移动设备的位置,其包括以下步骤:通过几何剖分将无线通信空间中的预定多个参考位置剖分为多边形网格,其中各个参考位置分别构成各个多边形的顶点并且与一个或多个参考无线信号特征相关联;通过给定无线信号特征与参考无线信号特征来确定移动设备的位置所在的多边形;以及通过所确定的多边形的顶点位置,确定移动设备的位置。

    对序列进行处理的装置和方法

    公开(公告)号:CN103729528A

    公开(公告)日:2014-04-16

    申请号:CN201210390510.5

    申请日:2012-10-15

    Abstract: 本发明涉及对序列进行处理的装置和方法。对序列进行处理的装置包括:指示性子序列提取单元,被配置用于从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的指示性子序列;种子提取单元,被配置用于从序列中提取与指示性子序列最相似的子序列作为种子;第一子序列提取单元,被配置用于从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长;以及类似子序列提取单元,被配置用于从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。

Patent Agency Ranking