-
公开(公告)号:CN105446958A
公开(公告)日:2016-03-30
申请号:CN201410344476.7
申请日:2014-07-18
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明公开了词对齐方法和词对齐设备。根据本发明的词对齐方法用于将源语言和目标语言的双语句对中的源语言词语和目标语言词语对齐,该词对齐方法包括:将所述源语言词语和所述目标语言词语转换为源语言词向量和目标语言词向量;利用映射模型,确定与所述源语言词向量对应的参考目标语言词向量;计算所述参考目标语言词向量与所述目标语言词向量之间的相似度;以及将所计算的相似度作为特征,利用基于特征函数的词对齐模型,对齐所述源语言词语和所述目标语言词语。
-
公开(公告)号:CN104679754A
公开(公告)日:2015-06-03
申请号:CN201310616088.5
申请日:2013-11-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种用于数据预测的模型选择设备和方法。该模型选择设备包括:矩阵分解单元,被配置为对预测矩阵进行奇异值分解,其中,预测矩阵的行/列向量是样本向量,列/行向量是对应维度的特征向量,样本向量之一是包含待预测特征序列的待预测向量;模型选择单元,被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。根据本公开的方案可以降低矩阵计算维度、减少噪声,从而达到自动、准确地选择预测模型的效果。
-
公开(公告)号:CN104572613A
公开(公告)日:2015-04-29
申请号:CN201310495278.6
申请日:2013-10-21
Applicant: 富士通株式会社
Abstract: 本申请公开了一种用于判断社会性服务网络中用户发布的文本是否是问题的数据处理装置,包括:主题特征获取单元,被配置为利用预先训练的主题模型获取文本的主题特征;情感特征获取单元,被配置为利用预先训练的情感模型获取文本的情感特征;疑问标记特征提取单元,被配置为获取文本的疑问标记特征;以及分类器,被配置为利用主题特征、情感特征和疑问标记特征对文本进行分类。
-
公开(公告)号:CN104699685B
公开(公告)日:2018-02-09
申请号:CN201310647831.3
申请日:2013-12-04
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本申请公开了一种模型更新装置及方法、数据处理装置及方法,用于对多模型系统中的目标模型进行更新,其中,多模型系统中的各个模型是针对训练数据集采用不同方式预先训练得到的模型,该模型更新装置包括:伪标签获取单元,使用校准模型对待测数据集进行处理,并将处理的结果作为伪标签;第一特征分布获取单元,基于伪标签获得待测数据集的特征分布;第二特征分布获取单元,基于目标模型获取训练数据集的特征分布;调整单元,基于训练数据集的特征分布和待测数据集的特征分布来调整目标模型的特征空间划分,以使得训练数据集和待测数据集针对该特征空间划分具有类似的分布;以及更新单元,基于调整后的特征空间划分使用训练数据集来更新目标模型。
-
公开(公告)号:CN104978471A
公开(公告)日:2015-10-14
申请号:CN201410136268.8
申请日:2014-04-04
Applicant: 富士通株式会社
IPC: G06F19/00
Abstract: 本发明公开了一种链接强度计算方法和链接强度计算设备。该方法包括:针对给定二部图中的选定链接,构建其N级完备子图,其中第0级子图包括该选定链接及其两端的两节点,第n+1级子图包括该二部图中的、以第n级子图中的所有链接两端的节点作为端点的链接及其两端的节点,其中N为预定正整数,且N>2,n为正整数,且N-2≥n≥0,分别计算该选定链接两端的两节点与第N-2级子图中的同类节点之间的相似度,分别计算该选定链接两端的两节点与第N-2级子图中的同类节点之间的共同链接程度值;以及基于该相似度和共同链接程度值、以及该选定链接两端的两节点与第N-2级子图中的异类节点之间链接的强度初始值,利用针对该二部图的链接强度模型,计算该选定链接的强度值。
-
公开(公告)号:CN104765728B
公开(公告)日:2017-07-18
申请号:CN201410009183.3
申请日:2014-01-08
Applicant: 富士通株式会社
Abstract: 本发明涉及对神经网络进行训练的方法和装置以及确定语料库中的词的稀疏特征向量的方法和装置。神经网络包括输入层、隐含层和输出层,输入层表示语料库中的作为当前词的词的原始特征向量,隐含层表示当前词的中间特征向量,输出层表示语料库中的下一词的预测概率。对神经网络进行训练的方法包括:将语料库中的每个词作为当前词,并将当前词的原始特征向量输入到输入层;以及训练神经网络使得下一词的预测概率总体上最高并利用惩罚项使得隐含层的中间特征向量的元素稀疏。
-
公开(公告)号:CN104699685A
公开(公告)日:2015-06-10
申请号:CN201310647831.3
申请日:2013-12-04
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本申请公开了一种模型更新装置及方法、数据处理装置及方法,用于对多模型系统中的目标模型进行更新,其中,多模型系统中的各个模型是针对训练数据集采用不同方式预先训练得到的模型,该模型更新装置包括:伪标签获取单元,使用校准模型对待测数据集进行处理,并将处理的结果作为伪标签;第一特征分布获取单元,基于伪标签获得待测数据集的特征分布;第二特征分布获取单元,基于目标模型获取训练数据集的特征分布;调整单元,基于训练数据集的特征分布和待测数据集的特征分布来调整目标模型的特征空间划分,以使得训练数据集和待测数据集针对该特征空间划分具有类似的分布;以及更新单元,基于调整后的特征空间划分使用训练数据集来更新目标模型。
-
公开(公告)号:CN103870458A
公开(公告)日:2014-06-18
申请号:CN201210526451.X
申请日:2012-12-07
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/951 , G06F16/93
Abstract: 本发明公开了一种数据处理装置,包括:链接结构生成单元,被配置为创建基于检索词搜索到的文档中的候选词之间的链接关系,以生成链接结构;潜在主题划分单元,被配置为计算每一个文档中的语句之间的依赖度信息,基于该依赖度信息对每一个文档进行主题划分并获得主题划分在该文档中的权重,其中,所述语句分别包括检索词和/或候选词;词评分单元,被配置为基于链接结构和主题划分对候选词以及候选词的对进行评分,并且将评分提供给潜在主题划分单元以用于计算依赖度信息和进行主题划分;以及控制单元,被配置为控制潜在主题划分单元和词评分单元,使其基于主题划分和评分的相互影响循环迭代操作,直到满足预定条件为止。
-
公开(公告)号:CN103870458B
公开(公告)日:2017-07-18
申请号:CN201210526451.X
申请日:2012-12-07
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本申请公开了一种数据处理装置,包括:链接结构生成单元,被配置为创建基于检索词搜索到的文档中的候选词之间的链接关系,以生成链接结构;潜在主题划分单元,被配置为计算每一个文档中的语句之间的依赖度信息,基于该依赖度信息对每一个文档进行主题划分并获得主题划分在该文档中的权重,其中,所述语句分别包括检索词和/或候选词;词评分单元,被配置为基于链接结构和主题划分对候选词以及候选词的对进行评分,并且将评分提供给潜在主题划分单元以用于计算依赖度信息和进行主题划分;以及控制单元,被配置为控制潜在主题划分单元和词评分单元,使其基于主题划分和评分的相互影响循环迭代操作,直到满足预定条件为止。
-
公开(公告)号:CN104679754B
公开(公告)日:2018-01-02
申请号:CN201310616088.5
申请日:2013-11-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种用于数据预测的模型选择设备和方法。该模型选择设备包括:矩阵分解单元,被配置为对预测矩阵进行奇异值分解,其中,预测矩阵的行/列向量是样本向量,列/行向量是对应维度的特征向量,样本向量之一是包含待预测特征序列的待预测向量;模型选择单元,被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。根据本公开的方案可以降低矩阵计算维度、减少噪声,从而达到自动、准确地选择预测模型的效果。
-
-
-
-
-
-
-
-
-