评价对象聚类方法和装置

    公开(公告)号:CN102375848B

    公开(公告)日:2016-03-02

    申请号:CN201010260750.4

    申请日:2010-08-17

    Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置.所述方法包括:基于语素提取评价对象的语素特征作为内部关联特征,其中语素是最小的语法单位,也是最小的语音、语义结合体;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征,其中外部关联特征包括评价对象的预定大小的窗口内的评价词;利用所述内部关联特征和所述外部关联特征对所述评价对象进行第一聚类;以及将第一聚类的结果作为约束条件,对评价对象进行第二聚类,以获取进一步的聚类结果,约束条件包括必属于同一类的约束条件和不属于同一类的约束条件。

    信息处理方法、信息处理装置和信息推荐方法

    公开(公告)号:CN105335371A

    公开(公告)日:2016-02-17

    申请号:CN201410259034.2

    申请日:2014-06-11

    Abstract: 公开了一种信息处理方法、信息处理装置和信息推荐方法,该信息处理方法包括:分词步骤,对预定数据库中的条形码数据指示的产品信息进行分词并将这些分词结果确定为关键词;关键词分类确定步骤,根据关键词在预定数据库中的统计信息而确定关键词对应的分类;以及关系建立步骤,建立条形码数据、关键词和关键词的分类之间的关系并且将该关系存储在预定数据库中。根据本公开的实施例,可以为用户提供基于条形码的扩展查询服务。

    确定针对特定话题的情绪及其原因的方法和设备

    公开(公告)号:CN105335347A

    公开(公告)日:2016-02-17

    申请号:CN201410239139.1

    申请日:2014-05-30

    Inventor: 宋双永 孟遥

    Abstract: 本发明公开了确定针对特定话题的情绪及其原因的方法和设备。根据本发明的确定针对特定话题的情绪及其原因的方法包括:收集针对特定话题的多个文档;设定主题模型使得:主题的数量等于情绪种类的预定数量,每个主题的主题词包括一种对应情绪的情绪词并且一种情绪的情绪词仅在对应的一种主题的主题词中出现;利用所设定的主题模型,分析所述多个文档,以得到所述预定数量的主题、以及每个主题的主题词;以及从每个主题的主题词中,确定与该主题对应的情绪相关联的原因。

    抽取姓名词典和翻译规则表的方法和设备

    公开(公告)号:CN105095194A

    公开(公告)日:2015-11-25

    申请号:CN201410222052.3

    申请日:2014-05-23

    Abstract: 本发明公开了抽取姓名词典和翻译规则表的方法和设备。根据本发明的抽取用于在日文姓名与英文姓名之间进行翻译的姓名词典和翻译规则表的方法包括:收集英日姓名语料库,其包括日文姓名及对应的英文姓名;针对所收集的日文姓名和英文姓名,划分日文姓名和英文姓名;利用日文汉字发音表,将日文姓名中的日文汉字与英文姓名中的英文音节对齐,该对齐结果作为切分结果,所述日文汉字发音表中记载了日文汉字及其对应的一种或多种英文字符串,所述英文字符串包括一个或多个英文音节;根据上述对齐结果,抽取所述姓名词典和翻译规则表。

    预测给定话题的未来发展趋势的方法和装置

    公开(公告)号:CN102999539B

    公开(公告)日:2015-11-25

    申请号:CN201110279874.1

    申请日:2011-09-13

    Abstract: 本发明涉及预测给定话题的未来发展趋势的方法和装置。该方法包括:确定给定话题在多个过去时间段中的每个过去时间段被一个或多个博文提及的次数;根据提及给定话题的博文的博主到多个过去时间段中的每个过去时间段为止发表的博文中所提及的话题,确定博主到多个过去时间段中的每个过去时间段为止的兴趣;估计给定话题与博主到多个过去时间段中的每个过去时间段为止的兴趣之间的相似度;确定博主到多个过去时间段中的每个过去时间段为止的粉丝数量;根据到多个过去时间段中的每个过去时间段为止的相似度和粉丝数量,确定到多个过去时间段中的每个过去时间段为止的粉丝指数;以及根据提及次数和粉丝指数,预测给定话题的未来发展趋势。

    对负荷进行预测的方法和装置

    公开(公告)号:CN102968669B

    公开(公告)日:2015-11-25

    申请号:CN201110270387.9

    申请日:2011-08-31

    Abstract: 本发明提出一种对负荷进行预测的方法和装置。对负荷进行预测的方法包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。

    机器学习方法和装置

    公开(公告)号:CN102402713B

    公开(公告)日:2015-11-25

    申请号:CN201010280239.0

    申请日:2010-09-09

    Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。

    一种韵律标注的方法及韵律标注设备

    公开(公告)号:CN102881285B

    公开(公告)日:2015-10-21

    申请号:CN201110204284.2

    申请日:2011-07-15

    Inventor: 张波 孟遥 于浩

    Abstract: 本发明实施例公开了一种韵律标注的方法及专用标注设备,所述方法包括:接收模块,用于接收待标注的音频数据标识,所述音频数据标识包括音频数据的批次和/或数据条目号;播放模块,用于依据所述音频数据标识向标注者播放相对应的音频数据;记录模块,用于在检测到所述标注者触发了标注过程的情况下,记录与所述标注者的标注行为相关的信息;生成模块,用于根据所述与标注者的标注行为相关的信息生成所述音频数据的音频标注信息。通过本发明实施例,能够使标注的音频标注数据更准确,进而也使得采用音频标注数据进行语音合成的准确度或者流畅程度都能够满足实际需求。本发明实施例提供的专用标注设备也更适合盲人使用。

    人物搜索方法和设备
    169.
    发明授权

    公开(公告)号:CN102999538B

    公开(公告)日:2015-09-30

    申请号:CN201110279602.1

    申请日:2011-09-08

    Abstract: 本发明提供了一种人物搜索方法和设备,该方法包括:文档获取步骤,以给定的人物名称作为关键词进行搜索,以获取与该人物名称相关的多个文档;预处理步骤,对所获取的多个文档进行预处理,以获得多个文档的相关信息;特征提取步骤,从所获得的相关信息中提取文档特征;特征优化步骤,针对每个特征,如果该特征在预设的禁止特征集合中,则滤除该特征;文档相似度计算步骤,利用优化后的特征,计算多个文档中每两个文档之间的相似度;以及文档聚类步骤,基于算出的相似度,对多个文档进行聚类,并输出聚类结果,其中不同类别代表具有相同名称的不同人物。根据本发明的实施例,能够提高聚类性能,并且能够提高召回率,从而改善了用户体验。

    对来自传感器网络的数据包进行同步的装置和方法

    公开(公告)号:CN102857333B

    公开(公告)日:2015-06-17

    申请号:CN201110190236.2

    申请日:2011-06-28

    Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。输出时间确定单元根据数据包的时间戳指示的时间与输入单元接收到数据包的时间之间的时间差的概率密度函数,按照希望的数据包到达率确定时延。

Patent Agency Ranking