对序列进行处理的装置和方法

    公开(公告)号:CN103729528A

    公开(公告)日:2014-04-16

    申请号:CN201210390510.5

    申请日:2012-10-15

    Abstract: 本发明涉及对序列进行处理的装置和方法。对序列进行处理的装置包括:指示性子序列提取单元,被配置用于从序列中提取待预测子序列之前的、对待预测子序列有指示性作用的指示性子序列;种子提取单元,被配置用于从序列中提取与指示性子序列最相似的子序列作为种子;第一子序列提取单元,被配置用于从序列中提取跟随在种子之后的以下第一子序列:该第一子序列和种子之间的位置关系与待预测子序列和指示性子序列之间的位置关系相同,且该第一子序列与待预测子序列等长;以及类似子序列提取单元,被配置用于从序列中提取与第一子序列有类似的变化趋势的多个子序列,以用于预测待预测子序列。

    数据处理方法和数据处理设备

    公开(公告)号:CN103514192A

    公开(公告)日:2014-01-15

    申请号:CN201210212254.0

    申请日:2012-06-21

    CPC classification number: G06F17/30864

    Abstract: 公开了一种数据处理方法和设备,该方法包括:微博搜索步骤,在搜索引擎中输入给定实体的名称,以获取与该名称相关的多条微博作为目标集合;预处理步骤,对所获取的多条微博中的每条微博进行预处理,以获取与多条微博中的每条微博相关的正文信息;关系特征获取步骤,基于所获取的正文信息,获取多条微博中的各条微博的第一关系特征和第二关系特征,第一关系特征表示微博与给定实体的直接相关网页信息之间的关系,且第二关系特征表示微博与给定实体的间接相关网页信息之间的关系;以及相关性确定步骤,利用第一分类器和第二分类器,分别根据第一关系特征和第二关系特征,基于共同训练方式来确定多条微博中的各条微博与给定实体之间的相关性。

    信息处理装置和信息处理方法

    公开(公告)号:CN103377199A

    公开(公告)日:2013-10-30

    申请号:CN201210112493.9

    申请日:2012-04-16

    Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。

    人物搜索方法和设备
    95.
    发明公开

    公开(公告)号:CN102999538A

    公开(公告)日:2013-03-27

    申请号:CN201110279602.1

    申请日:2011-09-08

    Abstract: 本发明提供了一种人物搜索方法和设备,该方法包括:文档获取步骤,以给定的人物名称作为关键词进行搜索,以获取与该人物名称相关的多个文档;预处理步骤,对所获取的多个文档进行预处理,以获得多个文档的相关信息;特征提取步骤,从所获得的相关信息中提取文档特征;特征优化步骤,针对每个特征,如果该特征在预设的禁止特征集合中,则滤除该特征;文档相似度计算步骤,利用优化后的特征,计算多个文档中每两个文档之间的相似度;以及文档聚类步骤,基于算出的相似度,对多个文档进行聚类,并输出聚类结果,其中不同类别代表具有相同名称的不同人物。根据本发明的实施例,能够提高聚类性能,并且能够提高召回率,从而改善了用户体验。

    微博内容排序方法和微博内容排序装置

    公开(公告)号:CN102841908A

    公开(公告)日:2012-12-26

    申请号:CN201110190178.3

    申请日:2011-06-21

    Abstract: 本发明公开了一种微博内容排序方法和微博内容排序装置。根据本发明的微博内容排序方法包括:根据特定用户的关注网的关注信息计算待排序微博内容的博主评价得分;计算所述待排序微博内容的微博内容得分;将所述博主评价得分和所述微博内容得分加权计算,以得到所述待排序微博内容的综合评价得分;以及根据所述综合评价得分对所述待排序微博内容进行排序。

    用于名称消岐聚类的装置和方法

    公开(公告)号:CN102654881A

    公开(公告)日:2012-09-05

    申请号:CN201110056065.4

    申请日:2011-03-03

    Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:代表相似度确定单元,用于确定名称训练集的代表相似度,该代表相似度为该名称训练集中的文本间相似度的代表值;优选相似度阈值选择单元,用于采用不同的相似度阈值对该名称训练集进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值;以及函数拟合单元,用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数。

    评价对象聚类方法和装置

    公开(公告)号:CN102375848A

    公开(公告)日:2012-03-14

    申请号:CN201010260750.4

    申请日:2010-08-17

    Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置。所述方法包括:基于语素提取评价对象的语素特征;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征;以及利用所述语素特征和所述外部关联特征对所述评价对象进行第一聚类。

    提取商品属性信息的方法和设备

    公开(公告)号:CN101968788A

    公开(公告)日:2011-02-09

    申请号:CN200910164414.7

    申请日:2009-07-27

    Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。

Patent Agency Ranking