-
公开(公告)号:CN109947905A
公开(公告)日:2019-06-28
申请号:CN201710696739.4
申请日:2017-08-15
Applicant: 富士通株式会社
IPC: G06F16/332 , G06F16/2458
Abstract: 本发明公开了一种生成提问回答对的方法和设备。该方法包括:从已有提问回答对中,确定回答源自产品说明书的提问回答对;判断给定产品的说明书与回答源自产品说明书的提问回答对是否匹配;以及基于匹配的给定产品的说明书与回答源自产品说明书的提问回答对,生成针对给定产品的提问回答对。
-
公开(公告)号:CN109918058A
公开(公告)日:2019-06-21
申请号:CN201711328030.5
申请日:2017-12-13
Applicant: 富士通株式会社
IPC: G06F8/30
Abstract: 本公开涉及信息处理装置和信息处理方法以及用于在编程环境中推荐代码码片的方法。根据本公开的信息处理装置用于对元素集合中的若干元素构成的元素序列进行处理以预测后续元素,元素序列中的元素之间存在逻辑关系,该信息处理装置包括:第一预测单元,接收元素序列并且基于元素序列生成中间状态和第一预测结果;一个或更多个第二预测单元,其数目对应于元素集合中的元素类型的数目,针对每种元素类型存在一个对应的第二预测单元,第二预测单元接收中间状态并且基于中间状态以及与相应的元素类型相关的参数生成第二预测结果;以及确定单元,接收第一预测结果和第二预测结果并且基于第一预测结果和第二预测结果确定后续元素。
-
公开(公告)号:CN108960016A
公开(公告)日:2018-12-07
申请号:CN201710378870.6
申请日:2017-05-25
Applicant: 富士通株式会社
IPC: G06K9/00
CPC classification number: G06K9/0053 , G06K9/00335 , G06K9/00536 , G06T7/246
Abstract: 本发明公开了一种检测特定动作的方法和设备。该方法包括:将所收集的动作数据划分为多个具有预定时间长度的序列;确定每个序列的峰值;对于彼此距离小于预定时间长度的两个相邻峰值,去除所述两个相邻峰值之中较小的一个,直至所有峰值中每两个相邻峰值之间的距离都大于或等于预定时间长度;以及基于剩余峰值,确定代表特定动作的检测数据。
-
公开(公告)号:CN108694443A
公开(公告)日:2018-10-23
申请号:CN201710217479.8
申请日:2017-04-05
Applicant: 富士通株式会社
IPC: G06N3/08
CPC classification number: G06N3/08
Abstract: 本发明涉及基于神经网络的语言模型训练方法和装置。该方法包括:针对训练集中的每一个目标词,利用噪声生成网络生成目标词特征和噪声词特征,其中,目标词特征和噪声词特征具有各自对应的类别标签;利用上下文神经网络提取目标词的上下文特征;将目标词特征、噪声词特征以及上下文特征构成训练样本输入二分类器;迭代更新噪声生成网络的参数和上下文神经网络的参数,直到二分类器的预测误差接近预定值时停止更新;以及用训练得到的上下文神经网络作为语言模型。根据本发明的方法和装置可以训练得到一种收敛速度较快同时泛化能力较好的语言模型。
-
公开(公告)号:CN106294490A
公开(公告)日:2017-01-04
申请号:CN201510309500.8
申请日:2015-06-08
Applicant: 富士通株式会社
Abstract: 本发明公开了一种对数据样本进行特征增强的方法和装置以及分类器的训练方法和装置。根据本发明的一个方面,对数据样本进行特征增强的方法包括:针对预设的多个类中的每一类,计算多个数据样本的基准分布;计算所述多个数据样本在特征空间上的特征分布;以及基于所述基准分布和所述特征分布,对属于该类的少数数据样本中的至少一部分数据样本的特征进行修改以增强特征。由此,能够增强不均衡数据集中的少数数据样本的特征,从而使得该不均衡的数据集可用于训练诸如分类器的数据挖掘工具,并取得较好的效果。
-
公开(公告)号:CN106294343A
公开(公告)日:2017-01-04
申请号:CN201510240407.6
申请日:2015-05-13
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/355
Abstract: 本发明实施例提供一种数据聚类方法、模型融合方法以及装置。所述数据聚类方法包括:利用训练数据进行训练得到多个分类器模型;根据多个分类器模型预测验证数据的类别并得到预测结果矩阵;根据所述验证数据的特征以及所述预测结果矩阵,对所述验证数据的特征空间进行划分以将所述验证数据聚为多个类。本发明实施例不仅考虑数据自身的特征而且考虑不同模型在数据上的预测性能来对数据进行聚类;由此不仅能达到划分数据特征空间的目的,而且使数据特征空间的划分更适合多个模型的融合,能够提高融合系统的性能。
-
公开(公告)号:CN106156783A
公开(公告)日:2016-11-23
申请号:CN201510136857.0
申请日:2015-03-26
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 本发明公开了对待测数据样本进行分类的方法和装置。根据本发明的一个方面,对待测数据样本进行分类的方法包括:计算多个分类器中的每个分类器对所述待测数据样本的胜任值;以及根据每个分类器对所述待测数据样本的胜任值,从所述多个分类器中选取一个或一部分分类器对所述待测数据样本进行分类,其中每个分类器对所述待测数据样本的胜任值是根据已经过调整的、该分类器对所述待测数据样本的邻域空间所包含的验证数据样本的胜任值计算得出的,并且其中所述邻域空间包含类别已知的多个验证数据样本中与所述待测数据样本邻近的一部分验证数据样本。
-
公开(公告)号:CN106033425A
公开(公告)日:2016-10-19
申请号:CN201510106455.6
申请日:2015-03-11
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种数据处理设备和数据处理方法。数据处理设备包括:获取装置,用于根据预定规则选择历史数据作为训练数据集并且将所述历史数据划分为子训练数据集和子测试数据集,根据所述子训练数据集中数据的属性或属性的组合获取关于数据类型的信息,并且针对每个数据类型,通过利用在该数据类型下去噪后的子训练数据集所训练的分类器对所述子测试数据集进行预测并验证预测结果,以获得具有最优预测结果的最优数据类型;以及训练数据集选择装置,通过在该最优数据类型下对所述训练数据集中的数据进行去噪,来获得类别比例满足预定条件的训练数据集,以通过利用该满足预定条件的训练数据集所训练的分类器对测试数据集进行分类。
-
公开(公告)号:CN105335378A
公开(公告)日:2016-02-17
申请号:CN201410291263.2
申请日:2014-06-25
Applicant: 富士通株式会社
Abstract: 本发明实施例提供一种多数据源的信息处理装置、服务器及方法,该装置包括:第一判定单元,用于对至少两个数据源中的信息进行同一实体的判定;链接单元,用于将至少两个数据源中的实体链接到预先设定的外部资源中;第一扩展单元,用于根据外部资源中的信息对实体的属性进行扩展;第二判定单元,用于判断属性扩展后的信息是否满足预先设定的条件,当不满足预先设定的条件时,将属性扩展后的信息用于进行所述同一实体的判定,当满足预先设定的条件时,将属性扩展后的信息输出。通过对同一实体进行判定以及链接外部资源进行扩展属性,并且以迭代的方式进行上述判定和链接,能够有效的进行多数据源的信息整合,提高信息的准确性和全面性。
-
公开(公告)号:CN105095322A
公开(公告)日:2015-11-25
申请号:CN201410221701.8
申请日:2014-05-23
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了人名单元词典扩充方法、人名语言识别方法和装置,该人名单元词典扩充方法包括:计算各个词项在预定多个语言的人名单元词典中的初始权重;将人名划分为人名单元,将划分的人名单元与各个词典中的词项进行匹配以确定匹配人名单元和未匹配人名单元;根据匹配人名单元在各个词典中的权重来确定包含匹配人名单元的人名在各个词典中的权重;根据包含未匹配人名单元的所有人名在各个词典中的权重计算未匹配人名单元在各个词典中的权重,并将未匹配人名单元添加到词典中;根据包含匹配人名单元的所有人名在各个词典中的权重更新匹配人名单元在各个词典中的权重;重复上述处理直至满足预定条件,从而得到带权重标注的人名单元词典。
-
-
-
-
-
-
-
-
-