-
公开(公告)号:CN108959322B
公开(公告)日:2021-09-10
申请号:CN201710379515.0
申请日:2017-05-25
Applicant: 富士通株式会社
IPC: G06F16/583 , G06N3/04 , G06N3/08 , G06F40/284
Abstract: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。
-
公开(公告)号:CN111104624A
公开(公告)日:2020-05-05
申请号:CN201811249799.2
申请日:2018-10-25
Applicant: 富士通株式会社
IPC: G06F16/958 , G06F16/95
Abstract: 本申请公开了一种内容提取方法和设备以及计算机可读存储介质。该内容提取方法包括:基于HTML标签生成HTML页面的树;检测所述树中的每个节点所包含的特定内容特征的数目和文本长度特征的数目;滤除所述树中的特定内容特征的数目小于第一阈值或文本长度特征的数目小于第二阈值的节点;和确定所述树的剩余节点之中的、在相应分支上位于最底层的一个或更多个目标节点。
-
公开(公告)号:CN106294490B
公开(公告)日:2019-12-24
申请号:CN201510309500.8
申请日:2015-06-08
Applicant: 富士通株式会社
Abstract: 本发明公开了一种对数据样本进行特征增强的方法和装置以及分类器的训练方法和装置。根据本发明的一个方面,对数据样本进行特征增强的方法包括:针对预设的多个类中的每一类,计算多个数据样本的基准分布;计算所述多个数据样本在特征空间上的特征分布;以及基于所述基准分布和所述特征分布,对属于该类的少数数据样本中的至少一部分数据样本的特征进行修改以增强特征。由此,能够增强不均衡数据集中的少数数据样本的特征,从而使得该不均衡的数据集可用于训练诸如分类器的数据挖掘工具,并取得较好的效果。
-
公开(公告)号:CN107480687A
公开(公告)日:2017-12-15
申请号:CN201610405971.3
申请日:2016-06-08
Applicant: 富士通株式会社
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6267
Abstract: 本公开涉及信息处理装置和信息处理方法。根据本公开的信息处理装置包括:划分单元,将具有标签的训练数据的集合划分成第一训练数据集合D1和小于第一训练数据集合D1的第二训练数据集合D2;训练单元,使用第一训练数据集合D1中的训练数据i1按K个类对M个监督模型进行训练;预测单元,使用M个监督模型预测不具有标签的待测数据集合D3中的每个待测数据i3的标签;聚类单元,使用N个聚类模型对第二训练数据集合D2和待测数据集合D3中的数据i进行聚类;相似度图构造单元,基于聚类结果构造相似度图;以及融合单元,基于相似度图对待测数据i3的预测的标签和第二训练数据集合D2中的训练数据i2的标签进行融合处理以获得每个待测数据i3的标签。
-
公开(公告)号:CN103714389B
公开(公告)日:2017-08-01
申请号:CN201210370967.X
申请日:2012-09-28
Applicant: 富士通株式会社
CPC classification number: Y02E40/76 , Y04S10/545
Abstract: 本发明公开了一种智能电网的优化方法和优化设备。该方法包括如下步骤:收集智能电网中的各个装置的信息;各个装置以特征和操作来表征;根据所收集的信息,确定各个装置本身之间的关系、特征之间的关系和操作之间的关系;以及针对特定的优化目标,利用所确定的关系,结合约束条件,优化各个装置的操作。
-
公开(公告)号:CN103577414B
公开(公告)日:2017-04-12
申请号:CN201210254434.5
申请日:2012-07-20
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种数据处理方法和设备,该方法包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用检索词进行搜索来获取网页并从网页中挖掘候选关键词;评级步骤,用于基于检索词和/或候选关键词与网页之间的链接关系,对检索词和/或候选关键词以及网页进行评级;以及检索词选择步骤,用于基于评级结果从候选关键词中选择网页和候选关键词获取步骤中下次所用的检索词,重复执行网页和候选关键词获取步骤、评级步骤和检索词选择步骤,直到满足预定条件。根据本发明实施例,可以提高数据处理效率,更准确地从图片挖掘主题关键词和主题网页,从而有利于向用户进行后续的扩展应用和服务推荐。
-
公开(公告)号:CN102880621B
公开(公告)日:2017-03-01
申请号:CN201110203979.9
申请日:2011-07-14
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。
-
公开(公告)号:CN101968788B
公开(公告)日:2016-08-17
申请号:CN200910164414.7
申请日:2009-07-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了一种用于从包括评论语句的评论信息中提取商品属性信息的方法和设备。所述方法包括:a)对评论信息执行预处理;b)从预处理后的评论信息中提取出候选商品属性信息,并将出现次数满足预定条件的候选商品属性信息提取作为高频商品属性信息;c)通过利用从评论信息中获取的模板,进行基于模板的商品属性信息提取,以从评论信息中提取出补充商品属性信息;和d)根据预定过滤方法,对所述高频商品属性信息和补充商品属性信息进行过滤,并输出过滤后的商品属性信息。利用根据本发明实施例的方法和设备,可无指导地自动提取商品属性信息,而且在保证提取高频商品属性信息的同时,兼顾了商品属性信息提取过程中可能漏掉的非高频商品属性信息。
-
公开(公告)号:CN103377199B
公开(公告)日:2016-06-29
申请号:CN201210112493.9
申请日:2012-04-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。
-
公开(公告)号:CN105446958A
公开(公告)日:2016-03-30
申请号:CN201410344476.7
申请日:2014-07-18
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了词对齐方法和词对齐设备。根据本发明的词对齐方法用于将源语言和目标语言的双语句对中的源语言词语和目标语言词语对齐,该词对齐方法包括:将所述源语言词语和所述目标语言词语转换为源语言词向量和目标语言词向量;利用映射模型,确定与所述源语言词向量对应的参考目标语言词向量;计算所述参考目标语言词向量与所述目标语言词向量之间的相似度;以及将所计算的相似度作为特征,利用基于特征函数的词对齐模型,对齐所述源语言词语和所述目标语言词语。
-
-
-
-
-
-
-
-
-