-
公开(公告)号:CN116523987A
公开(公告)日:2023-08-01
申请号:CN202310505801.2
申请日:2023-05-06
Applicant: 北京理工大学
IPC: G06T7/50 , G06V10/26 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种语义引导的单目深度估计方法,包括以下步骤:获取单目图像并提取图像特征;对图像特征分别进行深度解码和语义分割,得到深度特征和语义特征;采用注意力机制计算深度特征和语义特征的注意力权重系数,并对深度特征进行优化,得到优化深度特征;根据源图像和所述优化深度特征,计算得到重建图像;根据重建图像和输入的单目图像计算损失函数,并通过损失函数训练模型;通过训练好的模型预测单目图像深度信息;本发明采用注意力机制完成语义分割对深度信息的引导,从而产生语义一致的中间深度表示,实现跨任务的特征融合,以此克服光度重建损失的局限性。