-
公开(公告)号:CN104239906B
公开(公告)日:2017-07-07
申请号:CN201310253005.0
申请日:2013-06-24
Applicant: 富士通株式会社
IPC: G06K9/66
Abstract: 本发明提供了构建装置和方法、图像分类装置和方法以及电子设备,以克服传统的图像分类技术由于未考虑图像的图像级特征和区域级特征之间的联系而导致分类结果不准确的问题。上述构建装置包括:将训练图像分割为多个区域的训练图像分割单元;提取训练图像的图像级特征和区域的区域级特征的第一提取单元;及构建包括图像级支持向量机分类器和区域级支持向量机分类器的图像分类器的构建单元,其在训练过程中考虑了第一约束:针对训练图像集全集或子集中的每个训练图像,令区域级支持向量机分类器对该训练图像的多个区域的分类结果中的最大值和图像级支持向量机分类器对该训练图像的分类结果尽量接近。本发明的上述技术能够应用于图像处理领域。
-
公开(公告)号:CN103678315B
公开(公告)日:2017-04-19
申请号:CN201210320320.6
申请日:2012-08-31
Applicant: 富士通株式会社
Abstract: 本公开提供一种图像处理装置、图像处理方法和电子设备。图像处理装置包括预处理单元,其对输入图像进行包括多层分割的预处理,以得到包括多个父区域和多个子区域的多个图像区域,其中每个父区域包括将其作为分割对象分割后得到的多个子区域;计算单元,其针对每个图像区域计算图像特征,并且基于该图像特征、利用训练好的图像语义分类器确定该图像区域的语义;输入图像语义确定单元,其根据每个父区域的语义及所包含的子区域的语义确定该父区域的最终语义,从而确定与输入图像相对应的语义信息;以及检索单元,其根据语义信息进行检索,以获得与输入图像相关的信息。本公开能够在不清楚检索对象的确切名称的情况下获取与检索对象相关的信息。
-
公开(公告)号:CN106157974A
公开(公告)日:2016-11-23
申请号:CN201510161880.5
申请日:2015-04-07
Applicant: 富士通株式会社
Abstract: 本公开涉及文本背诵质量评估装置和方法。所述装置包括:获取单元,用于获取通过背诵文本而产生的文本背诵特征曲线;分割单元,用于对所述文本背诵特征曲线进行分割,以获取所述文本中每个字的字背诵特征曲线;韵律得分获取单元,用于将所述每个字的字背诵特征曲线与每个字的字标准特征曲线进行比较,以获取每个字的韵律得分;声学得分获取单元,用于根据所述每个字的字背诵特征曲线确定所述每个字的背诵准确度,以获取每个字的声学得分;以及评估单元,用于基于每个字的韵律得分和声学得分对所述文本的背诵质量进行评估。由于能够针对每个字的韵律和发声进行打分,从而可以对文本的背诵质量进行评估,使得评估的结果更加精确且符合实际。
-
公开(公告)号:CN103578480B
公开(公告)日:2016-04-27
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN104732580A
公开(公告)日:2015-06-24
申请号:CN201310717083.1
申请日:2013-12-23
Applicant: 富士通株式会社
IPC: G06T17/00
Abstract: 本申请公开了一种图像处理装置、图像处理方法和程序,该图像处理装置包括:特定区域检测单元,被配置为获取对象的拍摄图像,并检测拍摄图像中显示的、对象的表面的所有特定区域;模型构建单元,被配置为基于拍摄图像来构建能够体现对象的形状的使用曲面方程描述的立体模型;定位单元,被配置为在立体模型的表面上定位各个特定区域的对应区域;以及面积计算单元,被配置为基于立体模型计算对应区域的面积。
-
公开(公告)号:CN102831129B
公开(公告)日:2015-03-04
申请号:CN201110171932.9
申请日:2011-06-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例公开了一种基于多示例学习的检索方法及系统,其中,所述方法包括:获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果。通过本发明,能够使得正训练包中的示例提供的信息得到更为充分的利用,提高检索性能。
-
公开(公告)号:CN102740106B
公开(公告)日:2014-12-03
申请号:CN201110085697.3
申请日:2011-03-31
Applicant: 富士通株式会社
CPC classification number: H04N5/23212 , G06T7/251 , G06T2207/10016
Abstract: 本发明实施例公开了在视频中检测摄像机运动类型的方法及装置,其中一种方法包括:估计所述视频中相邻帧之间的第一变焦运动参数;当所述第一变焦运动参数符合第一预置条件时,估计对应的视频片段中每隔预置数目的帧之间的第二变焦运动参数;以及当所述第二变焦运动参数符合第二预置条件时,将所述视频片段的摄像机运动类型识别为缓慢变焦。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型。
-
公开(公告)号:CN102831891B
公开(公告)日:2014-11-05
申请号:CN201110166864.7
申请日:2011-06-13
Applicant: 富士通株式会社
IPC: G10L15/02 , G10L15/183 , G10L17/26 , G10L25/63
Abstract: 本发明实施例公开了一种语音数据处理方法及系统,其中,所述方法包括:将待处理语音数据划分为语音片段;提取各个语音片段中的声学特征,并获取各个语音片段在所述语音数据中的上下文信息;针对各个语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定语音片段在各种情感状态下分别所属的语音片段类别;根据语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定语音片段属于各种情感状态的概率,并根据所述概率,确定语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。通过本发明,能够提高语音情感识别的有效性及准确度。
-
公开(公告)号:CN102737243A
公开(公告)日:2012-10-17
申请号:CN201110085705.4
申请日:2011-03-31
Applicant: 富士通株式会社
IPC: G06K9/46
CPC classification number: G06K9/4671 , G06K9/6857
Abstract: 一种获取多幅图像的描述信息的方法及装置与图像匹配方法。获取多幅图像的描述信息的方法包括:针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;针对每幅图像,根据基于检测到的多个特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;以及针对每幅图像执行以下步骤:对该图像进行第n-1次分割,以得到该图像的多幅n-1级子图像;以及根据基于相应特征点所在的n-1级子图像得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息,其中n=2,3,......,K+1,以及K为正整数。
-
公开(公告)号:CN101727452B
公开(公告)日:2012-09-19
申请号:CN200810171186.1
申请日:2008-10-22
Applicant: 富士通株式会社
Abstract: 本发明提供了一种用于从第一图像中检测第二图像的图像处理方法和设备。该图像处理方法包括:针对所述第一图像和所述第二图像中的每个图像,为所述图像中的每个基元构建局部邻域结构,并且提取所述局部邻域结构的特征;根据所提取的局部邻域结构的特征,针对所述第二图像中的每个局部邻域结构,从所述第一图像中查找与其最相似的一个或多个局部邻域结构作为其候选匹配,并且针对每个候选匹配对,估计所述第二图像在所述第一图像中出现的变换参数;以及,以所估计出的变换参数作为参数空间中的向量,寻找所述参数空间中的密集区域,并且据此确定最终的变换参数。根据上述技术方案,可以以较低的计算复杂度和较高的检测准确度进行目标图像检测。
-
-
-
-
-
-
-
-
-