-
公开(公告)号:CN102855497A
公开(公告)日:2013-01-02
申请号:CN201110188933.4
申请日:2011-06-27
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了一种获取图像描述信息的方法及装置以及分类器训练方法。获取图像描述信息的方法包括:分割所述多幅图像,获得所述多幅图像的子图像;基于所述子图像相互之间的特征相似性,获得所述子图像的相似度因子;基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。本发明实施例在获得图像的描述信息时,可以根据该图像的特征及其对应的相似度因子进行计算,从而使图像中重要度大的区域的特征占有较大的比重,而重要度小的区域的特征占有较小的比重,例如使图像中前景对象在最终的特征中占有较大的比重,而背景内容占有较小的比重,有效的减小了背景噪声的影响,获得了更准确的图像描述信息。
-
公开(公告)号:CN102855462A
公开(公告)日:2013-01-02
申请号:CN201110192744.4
申请日:2011-07-01
Applicant: 富士通株式会社
Abstract: 本发明公开了确定人体动作周期及识别人体动作的方法和装置。所述确定视频中人体动作周期的方法包括:在预定的搜索范围内搜索人体姿态与当前帧相似的帧;如果在搜索范围内搜索到人体姿态与当前帧相似的帧,则将当前帧与所述人体姿态与当前帧相似的帧之间的时长作为视频中的人体动作周期。通过针对不同行为、不同个体来确定相应的人体动作周期,可以更为准确地提取时空特征,并实现更为准确的人体行为识别。
-
公开(公告)号:CN102831891A
公开(公告)日:2012-12-19
申请号:CN201110166864.7
申请日:2011-06-13
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了一种语音数据处理方法及系统,其中,所述方法包括:将待处理语音数据划分为语音片段;提取各个语音片段中的声学特征,并获取各个语音片段在所述语音数据中的上下文信息;针对各个语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定语音片段在各种情感状态下分别所属的语音片段类别;根据语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定语音片段属于各种情感状态的概率,并根据所述概率,确定语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。通过本发明,能够提高语音情感识别的有效性及准确度。
-
公开(公告)号:CN1760860B
公开(公告)日:2010-09-08
申请号:CN200510063768.4
申请日:2005-03-31
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06K9/00449 , G06K9/00476
Abstract: 本发明提供一种设备零件图像检索装置和检索方法,用于核对技术图纸中的设备零件图像与查询图像,该装置包括:分割单元,用于检测技术图纸中绘制的线,并将技术图纸分成一个或者多个子区域;非文本区域确定单元,用于确定该子区域是主要包括文本的文本区域还是主要包括文本以外内容的非文本区域;提取单元,用于从非文本区域提取设备零件图像;核对单元,用于核对查询图像和所提取的设备零件图像;以及空白检测方向校正单元,用于检测在所述技术图纸中的空白区域,并校正技术图纸的方向。
-
公开(公告)号:CN101727452A
公开(公告)日:2010-06-09
申请号:CN200810171186.1
申请日:2008-10-22
Applicant: 富士通株式会社
Abstract: 本发明提供了一种用于从第一图像中检测第二图像的图像处理方法和设备。该图像处理方法包括:针对所述第一图像和所述第二图像中的每个图像,为所述图像中的每个基元构建局部邻域结构,并且提取所述局部邻域结构的特征;根据所提取的局部邻域结构的特征,针对所述第二图像中的每个局部邻域结构,从所述第一图像中查找与其最相似的一个或多个局部邻域结构作为其候选匹配,并且针对每个候选匹配对,估计所述第二图像在所述第一图像中出现的变换参数;以及,以所估计出的变换参数作为参数空间中的向量,寻找所述参数空间中的密集区域,并且据此确定最终的变换参数。根据上述技术方案,可以以较低的计算复杂度和较高的检测准确度进行目标图像检测。
-
公开(公告)号:CN101261638B
公开(公告)日:2010-06-09
申请号:CN200810083542.4
申请日:2008-03-07
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30247 , G06K9/6204 , Y10S707/915
Abstract: 本发明提供了一种图像搜索的方法及装置。根据本发明的一个方面,一种通过使用查询图像从数据库中搜索表示图像的图像数据的方法,该图像数据包括表示图像的轮廓的形状的信息,该方法包括;获得表示所述查询图像的查询图像数据;提取表示所述查询图像的轮廓的形状的信息以及所述查询图像的骨架信息;基于所述查询图像的所述轮廓与所述骨架信息的比率确定所述查询图像是封闭区域类型还是开放区域类型以及基于图像和所述查询图像的形状的拓扑特性的相关性以及所述图像和所述查询图像的区域类型的相关性,从所述数据库检测图像数据。
-
公开(公告)号:CN119942394A
公开(公告)日:2025-05-06
申请号:CN202311446696.6
申请日:2023-11-01
Applicant: 富士通株式会社
IPC: G06V20/40 , G06V10/44 , G06V10/766
Abstract: 本申请公开一种对象识别装置、对象识别方法和计算机可读记录介质。该对象识别装置包括:特征提取单元,被配置成提取视频片段所包括的多个帧中的每个帧关于待识别对象的特征;质量估计单元,被配置成估计所述多个帧中的每个帧关于待识别对象的质量;划分单元,被配置成基于所述多个帧的质量将视频片段划分为多个子段;以及对象识别单元,被配置成基于所述多个子段中的每一个子段的质量大于或等于第一预定阈值的帧的特征,来获得视频片段的识别结果。
-
公开(公告)号:CN117152804A
公开(公告)日:2023-12-01
申请号:CN202210538374.3
申请日:2022-05-18
Applicant: 富士通株式会社
Abstract: 本公开内容涉及训练面部检测模型的方法和装置及面部检测方法。根据本公开内容的一个实施例,该训练模型的方法包括:提取当前批次的多个样本图像的全局特征;确定预测注意力掩码;确定图像的与各面部动作单元对应的局部特征;基于多个样本图像的与各面部动作单元对应的局部特征确定与面部动作单元集相关联的检测结果;基于检测结果确定检测损失;基于多个样本图像的各预测注意力掩码与相应预定注意力掩码的差别确定注意力损失;以及通过基于总损失调整面部检测模型的参数来优化面部检测模型。本公开内容的方法和装置的有益效果包括以下中的至少一个:改善模型的准确度鲁棒性。
-
公开(公告)号:CN116935298A
公开(公告)日:2023-10-24
申请号:CN202210318537.7
申请日:2022-03-29
Applicant: 富士通株式会社
Abstract: 本公开涉及监测自助购物中的异常的方法和自助购物异常监测装置。其中监测自助购物中的异常的方法包括:利用检测模型对监测视频进行检测,输出包括所检测的顾客的动作以及商品的位置的监测视频中的每一帧的检测结果;针对监测视频中的每一帧,基于检测结果来确定顾客与每一个商品交互时表示商品的位置的商品框;基于商品框来生成包括商品的轨迹的轨迹集;基于轨迹集中的每条轨迹的长度与持续时间中的至少一个以及轨迹的方向来判断该轨迹是否为真实轨迹;基于真实轨迹以及所检测的顾客的动作确定商品扫描数;基于真实轨迹来确定商品数;以及基于商品扫描数与商品数来判断是否存在异常。
-
公开(公告)号:CN110598840B
公开(公告)日:2023-04-18
申请号:CN201810607041.5
申请日:2018-06-13
Applicant: 富士通株式会社
IPC: G06N3/045 , G06N3/0464 , G06N3/096
Abstract: 提供了知识迁移方法、信息处理设备以及存储介质。知识迁移方法包括:获得针对预定任务而预先训练的第一模型;通过利用综合损失函数针对预定任务对第二模型进行训练,使得第二模型具有第一模型的知识,其中,该综合损失函数基于以第一模型对训练样本的关于预定任务的输出结果的准确性加权的第一损失函数、以及第二损失函数,其中,第一损失函数表示第二模型与第一模型对训练样本的处理结果之间的差异,并且第二损失函数表示第二模型对训练样本的关于预定任务的输出结果的准确性。
-
-
-
-
-
-
-
-
-