-
公开(公告)号:CN103678270B
公开(公告)日:2016-08-24
申请号:CN201210320606.4
申请日:2012-08-31
Applicant: 富士通株式会社
Abstract: 本发明公开了一种语义单元抽取方法和语义单元抽取设备。所述语义单元抽取方法包括:输入经过分词的目标语言的句子;获得与目标语言的句子对应的参考语言的句子;对参考语言的句子进行词性标注;获得目标语言的句子和参考语言的句子之间的词对齐关系;以及根据参考语言的句子的词性标注结果,借助于词对齐关系,抽取目标语言的句子的语义单元。
-
公开(公告)号:CN101968788B
公开(公告)日:2016-08-17
申请号:CN200910164414.7
申请日:2009-07-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。
-
公开(公告)号:CN103377199B
公开(公告)日:2016-06-29
申请号:CN201210112493.9
申请日:2012-04-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。
-
公开(公告)号:CN103366165B
公开(公告)日:2016-06-29
申请号:CN201210091193.7
申请日:2012-03-30
Applicant: 富士通株式会社
CPC classification number: G06T7/0085 , G06K9/3208 , G06K9/3233 , G06T7/12 , G06T7/136 , G06T2207/20164 , H04N1/00681
Abstract: 本发明提供了图像处理装置、图像处理方法以及设备,以至少提高在针对文档所捕获的图像所进行的图像处理中的文档角点提取精度。图像处理装置包括:用于提取文档的沿第一方向的边界线和粗测文档角点的提取单元,其中,第一方向是文档图像的水平方向或垂直方向;用于在粗测文档角点附近、在沿第一方向的边界线上确定候选页角点的确定单元;以及用于在候选页角点中确定文档的文档角点的选择单元。图像处理方法用于执行能够实现上述图像处理装置的功能的处理。上述设备包括上述图像处理装置。应用本发明的上述技术,能够提取到较精确的文档角点,获得较好的图像处理效果,可以应用于图像处理领域。
-
公开(公告)号:CN103164390B
公开(公告)日:2016-05-18
申请号:CN201110421595.4
申请日:2011-12-15
Applicant: 富士通株式会社
Abstract: 本发明提供了一种文档处理方法和装置。文档处理方法包括:根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的专业名词,并对使用不准确的专业名词进行修正;以及根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的名词搭配,并对使用不准确的名词搭配进行修正;其中,专业文档为采用目标语言的单语文档,上述双语包括目标语言和原始语言。文档处理装置被配置实现上述文档处理方法中包括的功能。应用本发明的文档处理方法和文档处理装置,可以适用于不同特定专业领域的专业文档处理。
-
公开(公告)号:CN102375848B
公开(公告)日:2016-03-02
申请号:CN201010260750.4
申请日:2010-08-17
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置.所述方法包括:基于语素提取评价对象的语素特征作为内部关联特征,其中语素是最小的语法单位,也是最小的语音、语义结合体;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征,其中外部关联特征包括评价对象的预定大小的窗口内的评价词;利用所述内部关联特征和所述外部关联特征对所述评价对象进行第一聚类;以及将第一聚类的结果作为约束条件,对评价对象进行第二聚类,以获取进一步的聚类结果,约束条件包括必属于同一类的约束条件和不属于同一类的约束条件。
-
公开(公告)号:CN102999539B
公开(公告)日:2015-11-25
申请号:CN201110279874.1
申请日:2011-09-13
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及预测给定话题的未来发展趋势的方法和装置。该方法包括:确定给定话题在多个过去时间段中的每个过去时间段被一个或多个博文提及的次数;根据提及给定话题的博文的博主到多个过去时间段中的每个过去时间段为止发表的博文中所提及的话题,确定博主到多个过去时间段中的每个过去时间段为止的兴趣;估计给定话题与博主到多个过去时间段中的每个过去时间段为止的兴趣之间的相似度;确定博主到多个过去时间段中的每个过去时间段为止的粉丝数量;根据到多个过去时间段中的每个过去时间段为止的相似度和粉丝数量,确定到多个过去时间段中的每个过去时间段为止的粉丝指数;以及根据提及次数和粉丝指数,预测给定话题的未来发展趋势。
-
公开(公告)号:CN102968669B
公开(公告)日:2015-11-25
申请号:CN201110270387.9
申请日:2011-08-31
Applicant: 富士通株式会社
Abstract: 本发明提出一种对负荷进行预测的方法和装置。对负荷进行预测的方法包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
-
公开(公告)号:CN102402713B
公开(公告)日:2015-11-25
申请号:CN201010280239.0
申请日:2010-09-09
Applicant: 富士通株式会社
IPC: G06N99/00
Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。
-
公开(公告)号:CN102881285B
公开(公告)日:2015-10-21
申请号:CN201110204284.2
申请日:2011-07-15
Applicant: 富士通株式会社
IPC: G10L15/22
Abstract: 本发明实施例公开了一种韵律标注的方法及专用标注设备,所述方法包括:接收模块,用于接收待标注的音频数据标识,所述音频数据标识包括音频数据的批次和/或数据条目号;播放模块,用于依据所述音频数据标识向标注者播放相对应的音频数据;记录模块,用于在检测到所述标注者触发了标注过程的情况下,记录与所述标注者的标注行为相关的信息;生成模块,用于根据所述与标注者的标注行为相关的信息生成所述音频数据的音频标注信息。通过本发明实施例,能够使标注的音频标注数据更准确,进而也使得采用音频标注数据进行语音合成的准确度或者流畅程度都能够满足实际需求。本发明实施例提供的专用标注设备也更适合盲人使用。
-
-
-
-
-
-
-
-
-