数据处理方法和数据处理设备

    公开(公告)号:CN103678407A

    公开(公告)日:2014-03-26

    申请号:CN201210358626.0

    申请日:2012-09-24

    CPC classification number: G06F17/30253

    Abstract: 提供了一种数据处理方法和数据处理设备,该方法包括:图片识别步骤,用于对图片进行识别,以获得多个识别结果词,并根据特定组合形式从多个识别结果词生成一个或多个检索词;初始化步骤,用于对利用检索词进行检索而获得的网页进行初始化,以获得多个语句;主题相关性确定步骤,用于确定所获得的各个语句之间的主题相关性;主题段落划分步骤,用于基于所确定的主题相关性将多个语句划分为多个段落并确定各个段落的主题性值;以及主题段落选择步骤,用于基于确定的各段落的主题性值,从多个段落中选择满足预定条件的主题段落。根据本发明的实施例,能够高效准确地获取与图片相关的网页的主题段落并确定图片的主题,有利于信息检索、集成和共享。

    数据处理方法和设备
    22.
    发明公开

    公开(公告)号:CN103577414A

    公开(公告)日:2014-02-12

    申请号:CN201210254434.5

    申请日:2012-07-20

    CPC classification number: G06F16/951

    Abstract: 本发明公开了一种数据处理方法和设备,该方法包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用检索词进行搜索来获取网页并从网页中挖掘候选关键词;评级步骤,用于基于检索词和/或候选关键词与网页之间的链接关系,对检索词和/或候选关键词以及网页进行评级;以及检索词选择步骤,用于基于评级结果从候选关键词中选择网页和候选关键词获取步骤中下次所用的检索词,重复执行网页和候选关键词获取步骤、评级步骤和检索词选择步骤,直到满足预定条件。根据本发明实施例,可以提高数据处理效率,更准确地从图片挖掘主题关键词和主题网页,从而有利于向用户进行后续的扩展应用和服务推荐。

    射频识别标签定位方法和装置

    公开(公告)号:CN102890765A

    公开(公告)日:2013-01-23

    申请号:CN201110209834.X

    申请日:2011-07-20

    Abstract: 本发明涉及射频识别标签定位方法和装置,其中该射频识别标签定位方法包括:使用RFID阅读器的天线在当前发射功率下读取多个标签第一预定次数;记录每个标签在天线的当前发射功率下被成功读取的次数;根据天线的当前发射功率、标签的最低反应功率以及标签之间距离的最小分辨率确定天线的下一发射功率;将确定的天线的下一发射功率作为天线的当前发射功率,重复执行以上步骤第二预定次数;计算每个标签被成功读取的次数的总和;以及根据每个标签被成功读取的次数的总和对多个标签进行排序,来确定各个标签相对于天线的排列顺序。

    数据处理装置、数据处理方法和程序

    公开(公告)号:CN103870458B

    公开(公告)日:2017-07-18

    申请号:CN201210526451.X

    申请日:2012-12-07

    Abstract: 本申请公开了一种数据处理装置,包括:链接结构生成单元,被配置为创建基于检索词搜索到的文档中的候选词之间的链接关系,以生成链接结构;潜在主题划分单元,被配置为计算每一个文档中的语句之间的依赖度信息,基于该依赖度信息对每一个文档进行主题划分并获得主题划分在该文档中的权重,其中,所述语句分别包括检索词和/或候选词;词评分单元,被配置为基于链接结构和主题划分对候选词以及候选词的对进行评分,并且将评分提供给潜在主题划分单元以用于计算依赖度信息和进行主题划分;以及控制单元,被配置为控制潜在主题划分单元和词评分单元,使其基于主题划分和评分的相互影响循环迭代操作,直到满足预定条件为止。

    文本挖掘方法和文本挖掘装置

    公开(公告)号:CN103678355B

    公开(公告)日:2017-03-01

    申请号:CN201210335708.3

    申请日:2012-09-11

    Abstract: 本发明涉及文本挖掘方法和文本挖掘装置。文本挖掘方法包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;按照多个关键词在文档中的出现顺序对计算出的分值进行排列,以得到代表文档的分值序列;以及利用分值序列进行与文本挖掘相关联的操作。

    选择参数的方法和装置
    26.
    发明授权

    公开(公告)号:CN103377298B

    公开(公告)日:2016-08-03

    申请号:CN201210122746.0

    申请日:2012-04-24

    Abstract: 本发明涉及选择参数的方法和装置。选择参数的方法包括:在已知时间序列中,提取最能指示目标时间序列的第一子已知时间序列;在已知时间序列中,提取与第一子已知时间序列最相似的多个第二子已知时间序列;针对每个第二子已知时间序列,在已知时间序列中,提取第三子已知时间序列作为测试数据,第三子已知时间序列的长度与目标时间序列的长度相同,并且第三子已知时间序列相对于第二子已知时间序列的位置关系与目标时间序列相对于第一子已知时间序列的位置关系相同;预先限定不同的多个参数集合;根据第三子已知时间序列来计算多个参数集合中的每个参数集合的预测准确度;根据预测准确度从多个参数集合中选择适当的参数集合。

    对序列进行处理的装置和方法

    公开(公告)号:CN103729530A

    公开(公告)日:2014-04-16

    申请号:CN201210391204.3

    申请日:2012-10-15

    Abstract: 本发明涉及一种对序列进行处理的装置和方法。对序列进行处理的装置包括:划分单元,被配置用于以多个不同的子序列长度,分别将序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使相似度的平均值最大的子序列长度作为序列的周期;识别单元,被配置用于在与周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对异常子序列进行校正以获得新的序列。

    文档处理方法和装置
    29.
    发明公开

    公开(公告)号:CN103631789A

    公开(公告)日:2014-03-12

    申请号:CN201210299975.X

    申请日:2012-08-21

    CPC classification number: G06F17/30705 G06F17/30707

    Abstract: 一种文档处理方法和装置,该方法包括:从多个文档中提取词汇,并且针对每个文档计算词汇的术语度并根据术语度确定术语;对该多个文档进行聚类,其中基于针对每个文档类最近确定的术语及其术语度来确定文档类间的相似度;基于最近的聚类结果重新计算词汇对于相应文档类的术语度,并针对每个文档类重新确定术语;以及重复进行聚类和重新确定术语的过程,直到满足预定截止条件为止。

    选择参数的方法和装置
    30.
    发明公开

    公开(公告)号:CN103377298A

    公开(公告)日:2013-10-30

    申请号:CN201210122746.0

    申请日:2012-04-24

    Abstract: 本发明涉及选择参数的方法和装置。选择参数的方法包括:在已知时间序列中,提取最能指示目标时间序列的第一子已知时间序列;在已知时间序列中,提取与第一子已知时间序列最相似的多个第二子已知时间序列;针对每个第二子已知时间序列,在已知时间序列中,提取第三子已知时间序列作为测试数据,第三子已知时间序列的长度与目标时间序列的长度相同,并且第三子已知时间序列相对于第二子已知时间序列的位置关系与目标时间序列相对于第一子已知时间序列的位置关系相同;预先限定不同的多个参数集合;根据第三子已知时间序列来计算多个参数集合中的每个参数集合的预测准确度;根据预测准确度从多个参数集合中选择适当的参数集合。

Patent Agency Ranking