-
公开(公告)号:CN102880621B
公开(公告)日:2017-03-01
申请号:CN201110203979.9
申请日:2011-07-14
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。
-
公开(公告)号:CN106354709A
公开(公告)日:2017-01-25
申请号:CN201510416972.3
申请日:2015-07-15
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种用户属性信息的分析装置、服务器及方法,该装置包括:处理单元,用于利用分类器对根据待处理用户的公开信息而获得的特征进行处理,获得待处理用户的属性类别以及与属性类别相应的置信度;确定单元,用于当与属性类别相应的置信度满足第一预设条件时,将属性类别确定为待处理用户的属性类别;当与属性类别相应的置信度不满足第一预设条件时,根据待处理用户的公开信息中的属性与时间的关系和/或属性的类别特征数,确定待处理用户的属性类别。通过根据属性类别的置信度进行不同的处理,并且当属性类别的置信度不满足预设条件时,根据属性与时间的关系和/或属性的类别特征数确定用户的属性类别,能够对用户的属性信息进行准确而全面的分析。
-
公开(公告)号:CN106326300A
公开(公告)日:2017-01-11
申请号:CN201510382448.9
申请日:2015-07-02
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/355
Abstract: 本公开提供一种信息处理方法和信息处理设备。该信息处理方法包括:将预定文本数据库中包括的关键词关联到预定语义知识数据库中,其中,关联到预定语义知识数据库中的关键词作为第一关键词构成第一关键词集合;计算第二关键词集合中的各个第二关键词与每个所述第一关键词之间的相似度,其中所述第二关键词集合由预定文本数据库中未关联到预定语义知识数据库中的第二关键词构成;以及根据第二关键词与各个第一关键词之间的相似度,将第一关键词在预定语义知识数据库中具有的可传递语义关系应用于该第二关键词。根据本公开的信息处理设备和信息处理方法能够容易、准确地将文本数据库中的关键词关联到预定语义知识库中。
-
公开(公告)号:CN106326228A
公开(公告)日:2017-01-11
申请号:CN201510336777.X
申请日:2015-06-17
Applicant: 富士通株式会社
CPC classification number: G06F16/9535 , G06Q50/01
Abstract: 本发明公开了一种评估用户的兴趣倾向的方法和装置。该方法包括:计算所述用户与其好友列表中的目标好友的关系分数;计算所述目标好友的自身倾向分数;以及根据所述关系分数和所述自身倾向分数计算所述用户关于所述目标好友的兴趣倾向程度。通过该方法,可评估用户的兴趣倾向,从而准确地为用户推送相关领域的内容或信息,以提升用户体验。
-
公开(公告)号:CN103365912B
公开(公告)日:2016-12-14
申请号:CN201210100155.3
申请日:2012-04-06
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供了一种对实体关系模式进行聚类、提取的方法和设备。对实体关系模式进行聚类的方法包括:对原始句子进行预处理,以识别原始句子中表示实体的实体词;根据实体词和关系词本体中的关系词以及实体词和关系词在预处理后的句子中的特定出现序列确定预处理后的句子中的实体词之间的实体关系,并且根据所确定的实体关系将预处理后的句子拆分成子句;提取拆分后的子句的实体关系模式,其中,子句的实体关系模式用实体词及实体词之间的中语境组成的关系元组来表示;计算所提取的子句的实体关系模式之间的第一相似度;以及根据所计算的子句的实体关系模式之间的第一相似度,将子句的实体关系模式聚类成实体关系模式类。
-
公开(公告)号:CN101989287B
公开(公告)日:2016-12-14
申请号:CN200910160943.X
申请日:2009-07-31
Applicant: 富士通株式会社
Abstract: 生成用于基于统计的机器翻译的规则的方法和设备。该设备包括:规则提取装置,其从平行语料库中提取规则;规则过滤装置,其从所提取的规则中过滤源语言短语或目标语言短语不是预定短语的任何一个的规则;规则识别装置,其从所提取的规则中识别由最小规则单调地构成的单调组合规则,其中源语言短语的顺序与源语言短语的对应目标语言短语的顺序相同,最小规则是不能进一步拆分出更小完整规则的规则,完整规则是对应关系不涉及该规则之外的短语的规则;以及短语提取装置,其从源语言或目标语言的单语语料库中提取统计特征满足预定要求的短语作为预定短语。规则过滤装置还从所提取的规则中过滤所识别的单调组合规则,统计特征包括所提取的短语的C-value值。
-
公开(公告)号:CN103678270B
公开(公告)日:2016-08-24
申请号:CN201210320606.4
申请日:2012-08-31
Applicant: 富士通株式会社
Abstract: 本发明公开了一种语义单元抽取方法和语义单元抽取设备。所述语义单元抽取方法包括:输入经过分词的目标语言的句子;获得与目标语言的句子对应的参考语言的句子;对参考语言的句子进行词性标注;获得目标语言的句子和参考语言的句子之间的词对齐关系;以及根据参考语言的句子的词性标注结果,借助于词对齐关系,抽取目标语言的句子的语义单元。
-
公开(公告)号:CN101968788B
公开(公告)日:2016-08-17
申请号:CN200910164414.7
申请日:2009-07-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。
-
公开(公告)号:CN103164390B
公开(公告)日:2016-05-18
申请号:CN201110421595.4
申请日:2011-12-15
Applicant: 富士通株式会社
Abstract: 本发明提供了一种文档处理方法和装置。文档处理方法包括:根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的专业名词,并对使用不准确的专业名词进行修正;以及根据专业名词及搭配双语语料库,判定专业文档中的使用不准确的名词搭配,并对使用不准确的名词搭配进行修正;其中,专业文档为采用目标语言的单语文档,上述双语包括目标语言和原始语言。文档处理装置被配置实现上述文档处理方法中包括的功能。应用本发明的文档处理方法和文档处理装置,可以适用于不同特定专业领域的专业文档处理。
-
公开(公告)号:CN105573971A
公开(公告)日:2016-05-11
申请号:CN201410532186.5
申请日:2014-10-10
Applicant: 富士通株式会社
IPC: G06F17/24
Abstract: 本发明涉及一种表格重构装置和方法。该装置包括:列属性确定单元,被配置成确定表格中每一列的属性;描述对象确定单元,被配置成通过将所确定的每一列的属性与语义知识库链接来确定表格中的描述对象;描述对象相关属性确定单元,被配置成在语义知识库中确定每个描述对象的属性集合,计算表格中每一列的属性与属性集合中的每个属性的第一相似度来确定表格中与描述对象相关的属性;以及表格重构单元,被配置成使用描述对象和与描述对象相关的属性对表格进行重构。根据本发明的表格重构装置和方法,能够将结构复杂、字段重叠、包括多个描述对象和属性的表格重构成结构简单、描述对象单一的单一描述对象表格。
-
-
-
-
-
-
-
-
-