-
公开(公告)号:CN116523987A
公开(公告)日:2023-08-01
申请号:CN202310505801.2
申请日:2023-05-06
Applicant: 北京理工大学
IPC: G06T7/50 , G06V10/26 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种语义引导的单目深度估计方法,包括以下步骤:获取单目图像并提取图像特征;对图像特征分别进行深度解码和语义分割,得到深度特征和语义特征;采用注意力机制计算深度特征和语义特征的注意力权重系数,并对深度特征进行优化,得到优化深度特征;根据源图像和所述优化深度特征,计算得到重建图像;根据重建图像和输入的单目图像计算损失函数,并通过损失函数训练模型;通过训练好的模型预测单目图像深度信息;本发明采用注意力机制完成语义分割对深度信息的引导,从而产生语义一致的中间深度表示,实现跨任务的特征融合,以此克服光度重建损失的局限性。
-
公开(公告)号:CN116468769A
公开(公告)日:2023-07-21
申请号:CN202310217308.0
申请日:2023-03-08
Applicant: 北京理工大学
IPC: G06T7/55 , G06N3/08 , G06N3/0464
Abstract: 本发明提供了一种基于图像的深度信息估计方法,包括:将同一场景的无标注图像序列输入至深度神经网络,提取图像特征;依次利用通道注意力机制和空间注意力机制对图像特征进行自适应特征优化;利用双线性差值进行上采样恢复图像分辨率;对恢复后的特征图像作为目标图像进行深度信息预测,根据预测的深度信息和相邻帧重建目标图像;计算目标图像与重建图像在多尺度下的光度误差和平滑误差,获得损失函数;进行无监督模型训练,根据损失函数更新模型参数,得到训练后的模型;利用训练后的模型对输入的场景图像进行深度信息预测。本发明可以充分利用输入图像的局部相关性和远程关系依赖提升低纹理区域的预测效果。
-