-
公开(公告)号:CN108875758B
公开(公告)日:2022-01-11
申请号:CN201710320880.4
申请日:2017-05-09
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从多个样本图像中的每个样本图像提取具有预定宽度和预定高度的一组特征图,其中,一组特征图中的特征图分别与不同的图像特征相对应;以及基于所提取的一组特征图和为多个样本图像标记的文字描述来训练文字描述模型,文字描述模型用于根据输入图像生成相应文字描述,其中,训练文字描述模型包括基于一组特征图和循环神经网络模型的前一状态向量,计算一组特征图上的关注窗口的中心和大小。根据本公开的实施例,能够产生图像的更合适的文字描述。
-
公开(公告)号:CN113807374A
公开(公告)日:2021-12-17
申请号:CN202010536138.9
申请日:2020-06-12
Applicant: 富士通株式会社
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:约束条件生成单元,基于样本集生成多个约束条件;样本分组单元,将样本集分组为与多个约束条件一一对应的多个样本子集;候选约束条件选择单元,选择目标对象符合的一个或更多个约束条件作为候选约束条件;模型训练单元,通过进行训练获取与每个候选约束条件对应的相应的经训练的白盒模型;白盒模型分数计算单元,基于与经训练的白盒模型对应的约束条件的置信度和/或支持度以及经训练的白盒模型的分类性能计算经训练的白盒模型的分数;以及分析结果输出单元,输出候选约束条件以及与候选约束条件对应的经训练的白盒模型的分数,作为目标对象的分析结果。
-
公开(公告)号:CN108959322B
公开(公告)日:2021-09-10
申请号:CN201710379515.0
申请日:2017-05-25
Applicant: 富士通株式会社
IPC: G06F16/583 , G06N3/04 , G06N3/08 , G06F40/284
Abstract: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。
-
公开(公告)号:CN107562752A
公开(公告)日:2018-01-09
申请号:CN201610509575.5
申请日:2016-06-30
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种对文本序列中实体词的语义关系进行分类的方法、装置和电子设备,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本实施例,能够提高分类效率。
-
公开(公告)号:CN104111917B
公开(公告)日:2017-04-12
申请号:CN201310138955.9
申请日:2013-04-19
Applicant: 富士通株式会社
IPC: G06F17/28
CPC classification number: G06F17/28
Abstract: 本发明提供了数据处理装置、数据处理方法以及电子设备,以克服现有的语言数据处理技术所存在的处理精度不高的问题。上述数据处理装置包括:语义角色标注单元,用于对源语言语句以及作为其译文的候选调序结果的多个目标语言语句分别进行语义角色标注,以获得源语言语义角色序列以及多个目标语言语义角色序列;匹配单元,用于基于预定双语语料库获得上述源语言语义角色序列分别与每个上述目标语言语义角色序列之间的匹配分数;以及调序结果确定单元,用于将匹配分数最高的目标语言语义角色序列对应的候选调序结果确定为最终调序结果。本发明的上述技术能够应用于数据处理领域。
-
公开(公告)号:CN106354709A
公开(公告)日:2017-01-25
申请号:CN201510416972.3
申请日:2015-07-15
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种用户属性信息的分析装置、服务器及方法,该装置包括:处理单元,用于利用分类器对根据待处理用户的公开信息而获得的特征进行处理,获得待处理用户的属性类别以及与属性类别相应的置信度;确定单元,用于当与属性类别相应的置信度满足第一预设条件时,将属性类别确定为待处理用户的属性类别;当与属性类别相应的置信度不满足第一预设条件时,根据待处理用户的公开信息中的属性与时间的关系和/或属性的类别特征数,确定待处理用户的属性类别。通过根据属性类别的置信度进行不同的处理,并且当属性类别的置信度不满足预设条件时,根据属性与时间的关系和/或属性的类别特征数确定用户的属性类别,能够对用户的属性信息进行准确而全面的分析。
-
公开(公告)号:CN101968788B
公开(公告)日:2016-08-17
申请号:CN200910164414.7
申请日:2009-07-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。
-
公开(公告)号:CN102375848B
公开(公告)日:2016-03-02
申请号:CN201010260750.4
申请日:2010-08-17
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及一种用于将评价对象聚类的方法和装置.所述方法包括:基于语素提取评价对象的语素特征作为内部关联特征,其中语素是最小的语法单位,也是最小的语音、语义结合体;基于评价对象的上下文提取评价对象的外部关联词语,作为所述评价对象的外部关联特征,其中外部关联特征包括评价对象的预定大小的窗口内的评价词;利用所述内部关联特征和所述外部关联特征对所述评价对象进行第一聚类;以及将第一聚类的结果作为约束条件,对评价对象进行第二聚类,以获取进一步的聚类结果,约束条件包括必属于同一类的约束条件和不属于同一类的约束条件。
-
公开(公告)号:CN105335371A
公开(公告)日:2016-02-17
申请号:CN201410259034.2
申请日:2014-06-11
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理方法、信息处理装置和信息推荐方法,该信息处理方法包括:分词步骤,对预定数据库中的条形码数据指示的产品信息进行分词并将这些分词结果确定为关键词;关键词分类确定步骤,根据关键词在预定数据库中的统计信息而确定关键词对应的分类;以及关系建立步骤,建立条形码数据、关键词和关键词的分类之间的关系并且将该关系存储在预定数据库中。根据本公开的实施例,可以为用户提供基于条形码的扩展查询服务。
-
公开(公告)号:CN105095194A
公开(公告)日:2015-11-25
申请号:CN201410222052.3
申请日:2014-05-23
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了抽取姓名词典和翻译规则表的方法和设备。根据本发明的抽取用于在日文姓名与英文姓名之间进行翻译的姓名词典和翻译规则表的方法包括:收集英日姓名语料库,其包括日文姓名及对应的英文姓名;针对所收集的日文姓名和英文姓名,划分日文姓名和英文姓名;利用日文汉字发音表,将日文姓名中的日文汉字与英文姓名中的英文音节对齐,该对齐结果作为切分结果,所述日文汉字发音表中记载了日文汉字及其对应的一种或多种英文字符串,所述英文字符串包括一个或多个英文音节;根据上述对齐结果,抽取所述姓名词典和翻译规则表。
-
-
-
-
-
-
-
-
-