-
公开(公告)号:CN111224670B
公开(公告)日:2023-09-15
申请号:CN201811424632.5
申请日:2018-11-27
Applicant: 富士通株式会社
Abstract: 公开了一种自动编码器及用于对自动编码器进行训练的方法和介质,所述自动编码器包括:编码器单元,其将输入数据映射为隐空间中的隐变量;约束单元,其对所述隐变量施加约束,以使所述隐变量聚集在所述隐空间中的中心点周围;以及解码器单元,其将来自所述约束单元的隐变量解码为重构数据,其中,对所述编码器单元、所述约束单元和所述解码器单元进行训练,以使得所述重构数据与所述输入数据近似匹配。根据本公开的自动编码器能够使得相似数据的隐变量表示在一个局部的隐空间之内,从而使得相似数据在该隐空间中距离不相似数据较远。
-
公开(公告)号:CN108335327B
公开(公告)日:2021-09-24
申请号:CN201710043704.0
申请日:2017-01-19
Applicant: 富士通株式会社
Abstract: 公开了一种摄像机姿态估计方法和摄像机姿态估计装置,摄像机姿态估计方法包括:获得彩色图像和深度图像;获取当前帧彩色图像的至少一个特征点和相邻帧彩色图像的至少一个相应匹配特征点;获取与当前帧彩色图像中的每个特征点的位置分别对应的当前帧深度图像中的至少一个特征点,获取与当前帧深度图像的每个特征点分别匹配的相邻帧深度图像中的至少一个相应匹配特征点;在世界坐标系下计算当前帧深度图像中的每个特征点和相邻帧深度图像中的相应匹配特征点之间的距离,并且通过使得针对每对匹配的特征点所计算出的距离之和最小来估计当前摄像机姿态。根据本公开的实施例,可以利用彩色图像和深度图像信息来实现精确的摄像机参数估计。
-
公开(公告)号:CN111224670A
公开(公告)日:2020-06-02
申请号:CN201811424632.5
申请日:2018-11-27
Applicant: 富士通株式会社
Abstract: 公开了一种自动编码器及用于对自动编码器进行训练的方法和介质,所述自动编码器包括:编码器单元,其将输入数据映射为隐空间中的隐变量;约束单元,其对所述隐变量施加约束,以使所述隐变量聚集在所述隐空间中的中心点周围;以及解码器单元,其将来自所述约束单元的隐变量解码为重构数据,其中,对所述编码器单元、所述约束单元和所述解码器单元进行训练,以使得所述重构数据与所述输入数据近似匹配。根据本公开的自动编码器能够使得相似数据的隐变量表示在一个局部的隐空间之内,从而使得相似数据在该隐空间中距离不相似数据较远。
-
公开(公告)号:CN111340056B
公开(公告)日:2023-09-08
申请号:CN201811553508.9
申请日:2018-12-18
Applicant: 富士通株式会社
Abstract: 提供了信息处理方法以及信息处理设备。信息处理设备能够被用于检测包含重复模式的图像文件中的异常,并且包括处理器,该处理器被配置为:利用预先训练好的自编码器对作为检测目标的图像文件的当前区域编码,以获得当前区域的隐藏变量;从图像文件中获取当前区域的相似区域,并利用自编码器对每个相似区域编码而获取每个相似区域的隐藏变量;基于所获取的相似区域的隐藏变量修改当前区域的隐藏变量;利用自编码器对修改后的隐藏变量解码,以获得当前区域的重构区域;以及比较当前区域与重构区域,并基于比较结果判断当前区域是否存在异常。
-
公开(公告)号:CN110766152B
公开(公告)日:2023-08-04
申请号:CN201810844262.4
申请日:2018-07-27
Applicant: 富士通株式会社
IPC: G06N3/08 , G06V10/82 , G06V10/762 , G06V10/774
Abstract: 本公开涉及一种用于训练深度神经网络的方法和装置。根据本公开的一个实施例,该方法包括以下步骤:针对训练集中的每个训练样本图像,使用深度神经网络根据训练样本图像生成相应的估计深度图;基于训练样本图像的训练样本深度图和估计深度图计算训练样本图像的损失;以及基于所计算的损失优化神经网络的参数,其中,损失包括基于训练样本深度图中的至少一个平面区域和估计深度图中的对应区域的对比计算的损失项。使用该方法和装置得到的训练后的深度神经网络能够在使用单幅输入图像的情况下,提高估计深度图的准确度。
-
公开(公告)号:CN108510536B
公开(公告)日:2021-09-21
申请号:CN201710111586.2
申请日:2017-02-28
Applicant: 富士通株式会社
IPC: G06T7/55
Abstract: 本发明公开了一种多视点图像的深度估计方法和深度估计设备。该方法包括:将同一场景的多个图像中的每个图像作为当前图像执行如下处理:获得当前图像中每个像素的初始深度值;将当前图像划分为多个超像素;基于所述初始深度值,根据预定约束条件,得到多个超像素的平面参数;以及基于超像素的平面参数,生成超像素中每个像素的深度值;其中,所述预定约束条件包括:共连接约束,所述共连接约束与彼此不遮挡的相邻超像素上的临近点的深度值差异有关。
-
公开(公告)号:CN109754416A
公开(公告)日:2019-05-14
申请号:CN201711070256.X
申请日:2017-11-03
Applicant: 富士通株式会社
Abstract: 本公开涉及图像处理装置和方法。所述图像处理装置包括转换器,其将输入图像转换为深度图像,以获得针对所述输入图像的每一像素的转换的深度;以及分类器,其在所述转换的深度和来自深度数据集的真实深度之间进行分类,其中,对所述分类器和所述转换器进行训练,直到所述分类器不能区分所述转换的深度和所述真实深度。使用根据本公开的图像处理装置和方法,通过对抗训练可以从单幅图像中学习深度,这不仅可以通过转换器学习单幅图像的深度,还可以通过分类器了解深度的高阶一致性。通过这样的对抗训练,转换器可以输出与真实深度图具有相似分布的深度图。
-
公开(公告)号:CN110766737B
公开(公告)日:2023-08-04
申请号:CN201810835621.X
申请日:2018-07-26
Applicant: 富士通株式会社
IPC: G06T7/50
Abstract: 公开了一种深度估计模型训练方法和设备以及存储介质。该方法包括:通过深度估计模型获得样本图像的估计深度图;在基于样本图像、其真实深度图和投影参数而获得的第一投影图中选择第一投影点,并且在基于样本图像、其估计深度图和投影参数而获得的第二投影图中选择第二投影点,第一和第二投影图具有相同的投影方向,并且第一投影点在第一投影图中的位置与第二投影点在第二投影图中的位置相同;确定第一和第二投影点在样本图像中的相对应的第一和第二点;通过使包括第一损失函数的总损失函数最小,来更新深度估计模型的参数,第一损失函数是关于第一和第二点的特征值之间的距离;和重复上述步骤,直到通过深度估计模型获得的估计深度图不再变化。
-
公开(公告)号:CN108335328B
公开(公告)日:2021-09-24
申请号:CN201710044456.1
申请日:2017-01-19
Applicant: 富士通株式会社
Abstract: 公开了一种摄像机姿态估计方法和摄像机姿态估计装置,摄像机姿态估计方法包括:获得彩色图像和深度图像;获取当前帧彩色图像的特征点和相邻帧彩色图像的相应匹配特征点;获取与当前帧彩色图像中的特征点的位置分别对应的当前帧深度图像中的特征点,获取与当前帧深度图像的特征点分别匹配的相邻帧深度图像中的相应匹配特征点;基于当前摄像机姿态和用于校正图像中的特征点的非刚性畸变的参数表示当前帧深度图像中的特征点的世界坐标;在世界坐标系下计算当前帧深度图像和相邻帧深度图像的每对匹配特征点之间的距离,以针对每对匹配的特征点所计算出的距离之和最小为目标,估计当前摄像机姿态和所述参数。可以消除摄像机参数估计中的非刚性畸变。
-
公开(公告)号:CN111340056A
公开(公告)日:2020-06-26
申请号:CN201811553508.9
申请日:2018-12-18
Applicant: 富士通株式会社
Abstract: 提供了信息处理方法以及信息处理设备。信息处理设备能够被用于检测包含重复模式的图像文件中的异常,并且包括处理器,该处理器被配置为:利用预先训练好的自编码器对作为检测目标的图像文件的当前区域编码,以获得当前区域的隐藏变量;从图像文件中获取当前区域的相似区域,并利用自编码器对每个相似区域编码而获取每个相似区域的隐藏变量;基于所获取的相似区域的隐藏变量修改当前区域的隐藏变量;利用自编码器对修改后的隐藏变量解码,以获得当前区域的重构区域;以及比较当前区域与重构区域,并基于比较结果判断当前区域是否存在异常。
-
-
-
-
-
-
-
-
-