-
公开(公告)号:CN110766152B
公开(公告)日:2023-08-04
申请号:CN201810844262.4
申请日:2018-07-27
Applicant: 富士通株式会社
IPC: G06N3/08 , G06V10/82 , G06V10/762 , G06V10/774
Abstract: 本公开涉及一种用于训练深度神经网络的方法和装置。根据本公开的一个实施例,该方法包括以下步骤:针对训练集中的每个训练样本图像,使用深度神经网络根据训练样本图像生成相应的估计深度图;基于训练样本图像的训练样本深度图和估计深度图计算训练样本图像的损失;以及基于所计算的损失优化神经网络的参数,其中,损失包括基于训练样本深度图中的至少一个平面区域和估计深度图中的对应区域的对比计算的损失项。使用该方法和装置得到的训练后的深度神经网络能够在使用单幅输入图像的情况下,提高估计深度图的准确度。
-
公开(公告)号:CN109785376B
公开(公告)日:2023-02-28
申请号:CN201711128851.4
申请日:2017-11-15
Applicant: 富士通株式会社
Abstract: 本发明公开了一种深度估计装置的训练方法、深度估计设备及存储介质。所述方法包括:向n个所述装置中的每个装置输入n个样本图像,输入至所述装置的n个样本图像的顺序被设置成使得各个装置所接收的第1个样本图像彼此不同,n为大于等于2的整数;利用所述装置所包含的第一神经网络,基于n个样本图像来估计第1个样本图像的深度图和从拍摄其他样本图像的相机的坐标系变换至拍摄第1个样本图像的相机的坐标系的变换矩阵;基于所述变换矩阵来构建使得n个装置相互关联的第一损失函数;以及通过使包括所述第一损失函数的总体损失函数最小化来确定所述装置的参数。
-
公开(公告)号:CN109559271B
公开(公告)日:2023-02-28
申请号:CN201710883474.9
申请日:2017-09-26
Applicant: 富士通株式会社
Abstract: 本发明涉及对深度图像进行优化的方法和装置。该对深度图像进行优化的方法包括:输入步骤,输入关于一个场景的多个彩色图像以及对应的深度图像;相机姿态估计步骤,基于输入的深度图像来估计相机姿态作为初始相机姿态;相机姿态优化步骤,基于多个彩色图像对所述初始相机姿态进行优化来获得优化的相机姿态;三维模型构建步骤,基于多个彩色图像和所获得的优化的相机姿态来构建三维模型;投影步骤,基于优化的相机姿态,将所构建的三维模型投影到二维坐标空间来生成每个彩色图像对应的投影深度图像;以及深度图像优化步骤,将所生成的投影深度图像和对应的输入的深度图像进行融合得到优化的深度图像。根据本发明的方法可以得到更精确的深度图像。
-
公开(公告)号:CN108510536B
公开(公告)日:2021-09-21
申请号:CN201710111586.2
申请日:2017-02-28
Applicant: 富士通株式会社
IPC: G06T7/55
Abstract: 本发明公开了一种多视点图像的深度估计方法和深度估计设备。该方法包括:将同一场景的多个图像中的每个图像作为当前图像执行如下处理:获得当前图像中每个像素的初始深度值;将当前图像划分为多个超像素;基于所述初始深度值,根据预定约束条件,得到多个超像素的平面参数;以及基于超像素的平面参数,生成超像素中每个像素的深度值;其中,所述预定约束条件包括:共连接约束,所述共连接约束与彼此不遮挡的相邻超像素上的临近点的深度值差异有关。
-
公开(公告)号:CN112861590A
公开(公告)日:2021-05-28
申请号:CN201911189799.2
申请日:2019-11-28
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置和方法以及图像识别设备。该信息处理装置包括:模板生成单元,被配置成生成针对多个不同面部姿态的多个2D面部关键点模板;模板选择单元,被配置成根据从输入图像检测到的面部图像中的面部姿态和/或关键点的位置,从多个2D面部关键点模板中选择用于所检测到的面部图像的2D面部关键点模板;以及图像剪切单元,被配置成至少根据所检测到的面部图像中的关键点的位置和所选择的2D面部关键点模板,从输入图像剪切出与所检测到的面部图像对应的剪切图像。
-
公开(公告)号:CN106558076B
公开(公告)日:2019-06-18
申请号:CN201510590009.7
申请日:2015-09-16
Applicant: 富士通株式会社
Abstract: 本发明公开了一种三维重建对象的方法和设备。该方法包括:获得三维空间中体素的初始局部TSDF值,每个初始局部TSDF值对应于多个深度图中的一个深度图;按对应的深度图,将初始局部TSDF值分组,至少一组初始局部TSDF值对应于不止一个深度图;针对每组初始局部TSDF值,得到该组的全局TSDF值;将所得到的各组的全局TSDF值作为初始局部TSDF值,求解最优化问题,以得到最终全局TSDF值;以及基于所得到的最终全局TSDF值,三维重建所述对象;其中,在所述最优化问题中,变量是体素的全局TSDF值和变换的参数,代价函数与下列因素相关:特定体素的全局TSDF值与该体素经变换对应的体素的初始局部TSDF值的差的平方的加权和,权重等于特定体素经变换对应的体素的对应组的权重。
-
公开(公告)号:CN109754416A
公开(公告)日:2019-05-14
申请号:CN201711070256.X
申请日:2017-11-03
Applicant: 富士通株式会社
Abstract: 本公开涉及图像处理装置和方法。所述图像处理装置包括转换器,其将输入图像转换为深度图像,以获得针对所述输入图像的每一像素的转换的深度;以及分类器,其在所述转换的深度和来自深度数据集的真实深度之间进行分类,其中,对所述分类器和所述转换器进行训练,直到所述分类器不能区分所述转换的深度和所述真实深度。使用根据本公开的图像处理装置和方法,通过对抗训练可以从单幅图像中学习深度,这不仅可以通过转换器学习单幅图像的深度,还可以通过分类器了解深度的高阶一致性。通过这样的对抗训练,转换器可以输出与真实深度图具有相似分布的深度图。
-
公开(公告)号:CN104732580B
公开(公告)日:2018-09-25
申请号:CN201310717083.1
申请日:2013-12-23
Applicant: 富士通株式会社
IPC: G06T17/00
Abstract: 本申请公开了一种图像处理装置、图像处理方法和程序,该图像处理装置包括:特定区域检测单元,被配置为获取对象的拍摄图像,并检测拍摄图像中显示的、对象的表面的所有特定区域;模型构建单元,被配置为基于拍摄图像来构建能够体现对象的形状的使用曲面方程描述的立体模型;定位单元,被配置为在立体模型的表面上定位各个特定区域的对应区域;以及面积计算单元,被配置为基于立体模型计算对应区域的面积。
-
-
公开(公告)号:CN105427272A
公开(公告)日:2016-03-23
申请号:CN201410474894.8
申请日:2014-09-17
Applicant: 富士通株式会社
Abstract: 本公开提供一种图像处理设备、图像处理方法和电子装置。该图像处理设备用于对预定图像进行分割的图像处理设备,包括:相似度确定装置,用于获取所述预定图像的超像素,并确定所述预定图像中各个像素与所获取的超像素之间的相似度;以及分类装置,用于在所述预定图像中获取至少两个标记像素组,其中每个标记像素组对应于一个用户输入,并根据所述预定图像中各个像素与所述超像素之间的相似度,将所述预定图像中的未标记像素划分到与所述至少两个标记像素组对应的至少两个像素类别中,以对所述预定图像进行分割。根据本公开的图像处理设备、图像处理方法和电子装置至少能够提高图像分割处理的运行速度。
-
-
-
-
-
-
-
-
-