-
公开(公告)号:CN102375848B
公开(公告)日:2016-03-02
申请号:CN201010260750.4
申请日:2010-08-17
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置.所述方法包括:基于语素提取评价对象的语素特征作为内部关联特征,其中语素是最小的语法单位,也是最小的语音、语义结合体;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征,其中外部关联特征包括评价对象的预定大小的窗口内的评价词;利用所述内部关联特征和所述外部关联特征对所述评价对象进行第一聚类;以及将第一聚类的结果作为约束条件,对评价对象进行第二聚类,以获取进一步的聚类结果,约束条件包括必属于同一类的约束条件和不属于同一类的约束条件。
-
公开(公告)号:CN102999539B
公开(公告)日:2015-11-25
申请号:CN201110279874.1
申请日:2011-09-13
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及预测给定话题的未来发展趋势的方法和装置。该方法包括:确定给定话题在多个过去时间段中的每个过去时间段被一个或多个博文提及的次数;根据提及给定话题的博文的博主到多个过去时间段中的每个过去时间段为止发表的博文中所提及的话题,确定博主到多个过去时间段中的每个过去时间段为止的兴趣;估计给定话题与博主到多个过去时间段中的每个过去时间段为止的兴趣之间的相似度;确定博主到多个过去时间段中的每个过去时间段为止的粉丝数量;根据到多个过去时间段中的每个过去时间段为止的相似度和粉丝数量,确定到多个过去时间段中的每个过去时间段为止的粉丝指数;以及根据提及次数和粉丝指数,预测给定话题的未来发展趋势。
-
公开(公告)号:CN102968669B
公开(公告)日:2015-11-25
申请号:CN201110270387.9
申请日:2011-08-31
Applicant: 富士通株式会社
Abstract: 本发明提出一种对负荷进行预测的方法和装置。对负荷进行预测的方法包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
-
公开(公告)号:CN102402713B
公开(公告)日:2015-11-25
申请号:CN201010280239.0
申请日:2010-09-09
Applicant: 富士通株式会社
IPC: G06N99/00
Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。
-
公开(公告)号:CN102999538B
公开(公告)日:2015-09-30
申请号:CN201110279602.1
申请日:2011-09-08
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明提供了一种人物搜索方法和设备,该方法包括:文档获取步骤,以给定的人物名称作为关键词进行搜索,以获取与该人物名称相关的多个文档;预处理步骤,对所获取的多个文档进行预处理,以获得多个文档的相关信息;特征提取步骤,从所获得的相关信息中提取文档特征;特征优化步骤,针对每个特征,如果该特征在预设的禁止特征集合中,则滤除该特征;文档相似度计算步骤,利用优化后的特征,计算多个文档中每两个文档之间的相似度;以及文档聚类步骤,基于算出的相似度,对多个文档进行聚类,并输出聚类结果,其中不同类别代表具有相同名称的不同人物。根据本发明的实施例,能够提高聚类性能,并且能够提高召回率,从而改善了用户体验。
-
公开(公告)号:CN102857333B
公开(公告)日:2015-06-17
申请号:CN201110190236.2
申请日:2011-06-28
Applicant: 富士通株式会社
Abstract: 一种对来自传感器网络的数据包进行同步的装置和方法。该装置包括:输入单元,其被配置为从至少两个传感器接收带有时间戳的数据包;输出时间确定单元,其被配置为将每个数据包的时间戳指示的时间与时延的和确定为数据包的最早输出时间,该时延取决于希望的数据包到达率;以及输出单元,其被配置为在存在最早输出时间早于当前时间的未输出数据包的情况下,按照时间戳指示的时间从早到晚的顺序输出这些未输出数据包。输出时间确定单元根据数据包的时间戳指示的时间与输入单元接收到数据包的时间之间的时间差的概率密度函数,按照希望的数据包到达率确定时延。
-
公开(公告)号:CN104679754A
公开(公告)日:2015-06-03
申请号:CN201310616088.5
申请日:2013-11-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种用于数据预测的模型选择设备和方法。该模型选择设备包括:矩阵分解单元,被配置为对预测矩阵进行奇异值分解,其中,预测矩阵的行/列向量是样本向量,列/行向量是对应维度的特征向量,样本向量之一是包含待预测特征序列的待预测向量;模型选择单元,被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。根据本公开的方案可以降低矩阵计算维度、减少噪声,从而达到自动、准确地选择预测模型的效果。
-
公开(公告)号:CN104572613A
公开(公告)日:2015-04-29
申请号:CN201310495278.6
申请日:2013-10-21
Applicant: 富士通株式会社
Abstract: 本申请公开了一种用于判断社会性服务网络中用户发布的文本是否是问题的数据处理装置,包括:主题特征获取单元,被配置为利用预先训练的主题模型获取文本的主题特征;情感特征获取单元,被配置为利用预先训练的情感模型获取文本的情感特征;疑问标记特征提取单元,被配置为获取文本的疑问标记特征;以及分类器,被配置为利用主题特征、情感特征和疑问标记特征对文本进行分类。
-
公开(公告)号:CN102831128B
公开(公告)日:2015-03-25
申请号:CN201110171903.2
申请日:2011-06-15
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例公开了一种对互联网上的同名人物信息进行分类的方法及装置,所述方法包括:针对输入的人物名称信息,检索包括所述人物名称信息的相关网页;分别抽取所述相关网页的人物属性特征和网页主题特征;利用上下位词典和/或同义词词典分别对所述人物属性特征和网页主题特征进行泛化;按照泛化后的人物属性特征获取所述相关网页的初始关系结果,并按照泛化后的网页主题特征获取所述相关网页的初始聚类结果;融合所述初始关系结果和所述初始聚类结果,以得到所述相关网页的最终分类结果。通过本发明实施例,能够更为精确和准确地对包括同样的人物名称的不同的相关网页进行聚类,从而得到更为准确的实际人物的分类结果。
-
公开(公告)号:CN104080039A
公开(公告)日:2014-10-01
申请号:CN201310100399.6
申请日:2013-03-26
Applicant: 富士通株式会社
Abstract: 本发明涉及一种无线定位方法和装置。该无线定位方法用于根据移动设备的给定无线信号特征来确定移动设备的位置,其包括以下步骤:通过几何剖分将无线通信空间中的预定多个参考位置剖分为多边形网格,其中各个参考位置分别构成各个多边形的顶点并且与一个或多个参考无线信号特征相关联;通过给定无线信号特征与参考无线信号特征来确定移动设备的位置所在的多边形;以及通过所确定的多边形的顶点位置,确定移动设备的位置。
-
-
-
-
-
-
-
-
-