-
公开(公告)号:CN104732580A
公开(公告)日:2015-06-24
申请号:CN201310717083.1
申请日:2013-12-23
Applicant: 富士通株式会社
IPC: G06T17/00
Abstract: 本申请公开了一种图像处理装置、图像处理方法和程序,该图像处理装置包括:特定区域检测单元,被配置为获取对象的拍摄图像,并检测拍摄图像中显示的、对象的表面的所有特定区域;模型构建单元,被配置为基于拍摄图像来构建能够体现对象的形状的使用曲面方程描述的立体模型;定位单元,被配置为在立体模型的表面上定位各个特定区域的对应区域;以及面积计算单元,被配置为基于立体模型计算对应区域的面积。
-
公开(公告)号:CN102831129B
公开(公告)日:2015-03-04
申请号:CN201110171932.9
申请日:2011-06-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明实施例公开了一种基于多示例学习的检索方法及系统,其中,所述方法包括:获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果。通过本发明,能够使得正训练包中的示例提供的信息得到更为充分的利用,提高检索性能。
-
公开(公告)号:CN102740106B
公开(公告)日:2014-12-03
申请号:CN201110085697.3
申请日:2011-03-31
Applicant: 富士通株式会社
CPC classification number: H04N5/23212 , G06T7/251 , G06T2207/10016
Abstract: 本发明实施例公开了在视频中检测摄像机运动类型的方法及装置,其中一种方法包括:估计所述视频中相邻帧之间的第一变焦运动参数;当所述第一变焦运动参数符合第一预置条件时,估计对应的视频片段中每隔预置数目的帧之间的第二变焦运动参数;以及当所述第二变焦运动参数符合第二预置条件时,将所述视频片段的摄像机运动类型识别为缓慢变焦。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型。
-
公开(公告)号:CN119904769A
公开(公告)日:2025-04-29
申请号:CN202311405705.7
申请日:2023-10-26
Applicant: 富士通株式会社
Abstract: 本公开涉及一种用于检测视频中的手的动作的装置、方法和存储介质。该装置包括:获取单元,其获取与视频中的每帧图像中的手的三维关键点有关的信息,与手的三维关键点有关的信息至少包括手的各个关节点在三维空间中的位置;计算单元,其基于与手的三维关键点有关的信息得到每帧图像的手部状态信息,手部状态信息至少包括指节弯曲状态;分析单元,其获得视频的时间片段中的手部状态信息的变化;以及确定单元,其基于手部状态信息的变化和与手的动作有关的规则来确定时间片段中的手进行的动作。该装置可以通过逐帧分析指节弯曲状态并制定手部动作规则来实现可复用的手部动作的检测。
-
公开(公告)号:CN118365577A
公开(公告)日:2024-07-19
申请号:CN202310047274.5
申请日:2023-01-18
Applicant: 富士通株式会社
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:第一检测网络,其分别获取关于图像中的对象的多个关键点中的每个关键点的第一信息,其中,第一检测网络是2D检测网络;第一信息获取单元,其获取指示对象的多个关键点之间的3D结构关系的第二信息;以及构建单元,其使用第一信息和第二信息来构建第一检测网络的损失函数,其中,图像处理装置使用损失函数来训练第一检测网络。由此,本申请通过在2D检测网络的训练中引入关键点之间的3D结构关系来提高2D检测网络的检测精度。
-
公开(公告)号:CN110766737B
公开(公告)日:2023-08-04
申请号:CN201810835621.X
申请日:2018-07-26
Applicant: 富士通株式会社
IPC: G06T7/50
Abstract: 公开了一种深度估计模型训练方法和设备以及存储介质。该方法包括:通过深度估计模型获得样本图像的估计深度图;在基于样本图像、其真实深度图和投影参数而获得的第一投影图中选择第一投影点,并且在基于样本图像、其估计深度图和投影参数而获得的第二投影图中选择第二投影点,第一和第二投影图具有相同的投影方向,并且第一投影点在第一投影图中的位置与第二投影点在第二投影图中的位置相同;确定第一和第二投影点在样本图像中的相对应的第一和第二点;通过使包括第一损失函数的总损失函数最小,来更新深度估计模型的参数,第一损失函数是关于第一和第二点的特征值之间的距离;和重复上述步骤,直到通过深度估计模型获得的估计深度图不再变化。
-
-
公开(公告)号:CN114821762A
公开(公告)日:2022-07-29
申请号:CN202110122104.X
申请日:2021-01-27
Applicant: 富士通株式会社
IPC: G06V40/20 , G06V10/82 , G06V10/774 , G06N3/02
Abstract: 本公开内容涉及用于检测个人的行为的方法、装置以及存储介质。根据本公开内容的一个实施例,该方法包括:基于摄像机拍摄的动作执行者的双手图像,确定摄像机的相对于动作执行者的方位为左侧还是右侧或者动作执行者的手臂在双手图像的左侧还是在双手图像的右侧,作为第一确定结果;基于由摄像机拍摄的由个人执行的第一动作的动作图像确定第一动作的感兴趣手为动作图像中的近处的手还是远处的手,作为第二确定结果;以及基于第一确定结果和第二确定结果确定第一动作的感兴趣手为左手还是右手。本公开内容的方法、装置和存储介质的有益效果至少包括:准确识别双手动作的感兴趣手。
-
公开(公告)号:CN108961381B
公开(公告)日:2022-02-01
申请号:CN201710347586.2
申请日:2017-05-17
Applicant: 富士通株式会社
IPC: G06T15/50
Abstract: 本公开涉及用于对物体的三维几何模型着色的方法和装置。根据本公开的用于对物体的三维几何模型着色的方法包括:基于拍摄物体得到的多个彩色图像构造所述物体的三维几何模型;执行所构造的三维几何模型与物体的给定的三维几何模型的对准;以及基于对准结果将多个彩色图像的颜色映射到给定的三维几何模型上。根据本公开的技术,可以在没有关于物体的二维彩色图像的深度信息的情况下准确和快速地建立物体的三维几何模型与二维彩色图像之间的空间对应关系,从而对三维几何模型着色。
-
公开(公告)号:CN108335328B
公开(公告)日:2021-09-24
申请号:CN201710044456.1
申请日:2017-01-19
Applicant: 富士通株式会社
Abstract: 公开了一种摄像机姿态估计方法和摄像机姿态估计装置,摄像机姿态估计方法包括:获得彩色图像和深度图像;获取当前帧彩色图像的特征点和相邻帧彩色图像的相应匹配特征点;获取与当前帧彩色图像中的特征点的位置分别对应的当前帧深度图像中的特征点,获取与当前帧深度图像的特征点分别匹配的相邻帧深度图像中的相应匹配特征点;基于当前摄像机姿态和用于校正图像中的特征点的非刚性畸变的参数表示当前帧深度图像中的特征点的世界坐标;在世界坐标系下计算当前帧深度图像和相邻帧深度图像的每对匹配特征点之间的距离,以针对每对匹配的特征点所计算出的距离之和最小为目标,估计当前摄像机姿态和所述参数。可以消除摄像机参数估计中的非刚性畸变。
-
-
-
-
-
-
-
-
-