评价对象聚类方法和装置

    公开(公告)号:CN102375848B

    公开(公告)日:2016-03-02

    申请号:CN201010260750.4

    申请日:2010-08-17

    Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置.所述方法包括:基于语素提取评价对象的语素特征作为内部关联特征,其中语素是最小的语法单位,也是最小的语音、语义结合体;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征,其中外部关联特征包括评价对象的预定大小的窗口内的评价词;利用所述内部关联特征和所述外部关联特征对所述评价对象进行第一聚类;以及将第一聚类的结果作为约束条件,对评价对象进行第二聚类,以获取进一步的聚类结果,约束条件包括必属于同一类的约束条件和不属于同一类的约束条件。

    对来自传感器网络的数据包进行同步的装置和方法

    公开(公告)号:CN102857333B

    公开(公告)日:2015-06-17

    申请号:CN201110190236.2

    申请日:2011-06-28

    Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。输出时间确定单元根据数据包的时间戳指示的时间与输入单元接收到数据包的时间之间的时间差的概率密度函数,按照希望的数据包到达率确定时延。

    一种对互联网上的同名人物信息进行分类的方法及装置

    公开(公告)号:CN102831128B

    公开(公告)日:2015-03-25

    申请号:CN201110171903.2

    申请日:2011-06-15

    Abstract: 本发明实施例公开了一种对互联网上的同名人物信息进行分类的方法及装置,所述方法包括:针对输入的人物名称信息,检索包括所述人物名称信息的相关网页;分别抽取所述相关网页的人物属性特征和网页主题特征;利用上下位词典和/或同义词词典分别对所述人物属性特征和网页主题特征进行泛化;按照泛化后的人物属性特征获取所述相关网页的初始关系结果,并按照泛化后的网页主题特征获取所述相关网页的初始聚类结果;融合所述初始关系结果和所述初始聚类结果,以得到所述相关网页的最终分类结果。通过本发明实施例,能够更为精确和准确地对包括同样的人物名称的不同的相关网页进行聚类,从而得到更为准确的实际人物的分类结果。

    用于名称消岐聚类的装置和方法

    公开(公告)号:CN102654881A

    公开(公告)日:2012-09-05

    申请号:CN201110056065.4

    申请日:2011-03-03

    Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:代表相似度确定单元,用于确定名称训练集的代表相似度,该代表相似度为该名称训练集中的文本间相似度的代表值;优选相似度阈值选择单元,用于采用不同的相似度阈值对该名称训练集进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值;以及函数拟合单元,用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数。

    评价对象聚类方法和装置

    公开(公告)号:CN102375848A

    公开(公告)日:2012-03-14

    申请号:CN201010260750.4

    申请日:2010-08-17

    Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置。所述方法包括:基于语素提取评价对象的语素特征;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征;以及利用所述语素特征和所述外部关联特征对所述评价对象进行第一聚类。

    构造索引库的方法和设备以及查询方法

    公开(公告)号:CN102135969A

    公开(公告)日:2011-07-27

    申请号:CN201010103610.6

    申请日:2010-01-22

    Abstract: 本发明提供了构造索引库的方法和设备以及查询方法。一种构造索引库的方法,包括:将一个或多个文档中的词汇分类为第一类别或第二类别;以及根据第一类别的词汇来构建单级索引,并根据第二类别的词汇来构建多级索引。本发明能够在支持大规模检索数据的同时提高整体检索响应速度。

    信息提取方法和装置
    9.
    发明公开

    公开(公告)号:CN101727451A

    公开(公告)日:2010-06-09

    申请号:CN200810171185.7

    申请日:2008-10-22

    Inventor: 贾文杰 于浩

    Abstract: 公开了一种信息提取方法和装置,用于从输入的信息源中提取涉及特定主题的有用信息。该方法包括:参考预先设定的第一资源,从信息源中查找并定位所有感兴趣的各类目标语素;从信息源中选择出所有包含所找到的各类目标语素的语句;参考预先设定的第二资源,对所选出的所有语句中的各类目标语素依次进行匹配;参考预先设定的描述向量提取规则,基于所述匹配结果,从信息源中提取出涉及特定主题的描述向量;以及基于所述描述向量,生成涉及特定主题的全局性信息,即为所述要提取的涉及特定主题的有用信息。在根据本发明的信息提取方法和装置中,无需对信息源进行词语划分和/或语法分析,因此可以较为简单和快速地从信息源中提取出所需的信息。

    一种分批聚类方法和系统
    10.
    发明授权

    公开(公告)号:CN102867006B

    公开(公告)日:2016-04-13

    申请号:CN201110189562.1

    申请日:2011-07-07

    Abstract: 本发明实施例提供一种分批聚类方法和系统,所述方法包括:按照预定策略对要聚类的文档进行分批;对分批后的每一批文档进行聚类,得到每一批文档的聚类结果;对每一批文档的聚类结果进行凝聚性处理,得到每一批文档的凝聚性处理结果;将除第一批文档以外的每一批文档的凝聚性处理结果中的每一类与上一批文档的凝聚性处理结果中的类合并,得到所述要聚类的文档的分批聚类结果。本实施例的分批聚类方法,通过对要聚类的文档进行分批聚类、批聚类结果的凝聚性处理以及批凝聚性处理结果的合并,提高了聚类性能,实现了增量式的聚类。

Patent Agency Ranking