-
公开(公告)号:CN117726666B
公开(公告)日:2024-06-04
申请号:CN202410175840.5
申请日:2024-02-08
Applicant: 北京邮电大学
IPC: G06T7/55 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/08
Abstract: 本申请提供跨相机单目图片度量深度估计方法、装置、设备及介质,属于计算机视觉技术领域。方法包括:将单目图片输入视场角对齐模块,得到待输入图片,将待输入图片输入神经网络编码器,得到第一特征图和特征信息;将第一特征图和多个预存嵌入特征向量输入多尺度场景信息提取器;将特征信息和第二特征图输入神经网络解码器;将多个特征向量中的一个特征向量输入场景分类器,其它特征向量输入域感知尺度估计器;根据多个中间度量尺度和分类概率,将每个待细化深度图和目标度量尺度输入深度细化模块,将预测深度图进行放大处理,得到目标深度图。本申请能在不同单目图片拍摄设备的配置和不同场景下,得到更精准的度量深度估计结果。
-
公开(公告)号:CN117726666A
公开(公告)日:2024-03-19
申请号:CN202410175840.5
申请日:2024-02-08
Applicant: 北京邮电大学
IPC: G06T7/55 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/08
Abstract: 本申请提供跨相机单目图片度量深度估计方法、装置、设备及介质,属于计算机视觉技术领域。方法包括:将单目图片输入视场角对齐模块,得到待输入图片,将待输入图片输入神经网络编码器,得到第一特征图和特征信息;将第一特征图和多个预存嵌入特征向量输入多尺度场景信息提取器;将特征信息和第二特征图输入神经网络解码器;将多个特征向量中的一个特征向量输入场景分类器,其它特征向量输入域感知尺度估计器;根据多个中间度量尺度和分类概率,将每个待细化深度图和目标度量尺度输入深度细化模块,将预测深度图进行放大处理,得到目标深度图。本申请能在不同单目图片拍摄设备的配置和不同场景下,得到更精准的度量深度估计结果。
-