-
公开(公告)号:CN115131554A
公开(公告)日:2022-09-30
申请号:CN202210294774.4
申请日:2022-03-23
Applicant: 南京大学
IPC: G06V10/26 , G06V10/774 , G06V20/00 , G06V10/40 , G06V10/56
Abstract: 本发明提供了一种基于多任务学习的室内RGBD图像语义分割算法,包括以下步骤:步骤1:收集RGBD图像数据集;步骤2:生成对应法向图;步骤3:提取多尺度图像特征;步骤4:提取深度图像多尺度深度特征;步骤5:形成融合特征;步骤6:辅助分支使用法向估计监督训练;步骤7:对融合特征进行上采样;步骤8:生成特定分辨率特征;步骤9:重复步骤7和步骤8,直到输出原分辨率大小特征;步骤10:预测图像语义信息,并监督训练;步骤11:引入空洞卷积池化金字塔模块;步骤12:将辅助任务分支改为语义分割监督并再次训练,增强了预测效果;本方法在语义分割任务上取得了极高的精度,而且适用性广泛,可适配不同任务组合,还可以应用于室内场景理解。
-
公开(公告)号:CN111429358B
公开(公告)日:2022-04-22
申请号:CN202010386239.2
申请日:2020-05-09
Applicant: 南京大学
IPC: G06T3/40 , G06T5/50 , G06T7/11 , G06T15/04 , G06V10/75 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于平面区域一致的图像拼接方法,包括:使用编码器‑解码器架构训练平面区域分割网络;使用该网络提取输入图像的平面区域;使用SIFT算法找到输入图像的特征点并进行匹配;利用平面区域分割结果和特征点,得到在多路图像中一致的平面区域及属于该区域的可靠匹配特征点对;使用上述特征点对计算出重叠区域的匹配点和局部的相似变换关系;采用网格变形架构,求解拼接后的网格坐标;利用纹理映射得到翘曲后的图像;对翘曲后的图像进行线性融合得到最终拼接结果。
-
公开(公告)号:CN113033645A
公开(公告)日:2021-06-25
申请号:CN202110290784.6
申请日:2021-03-18
Applicant: 南京大学
Abstract: 本发明公开了一种RGB‑D图像的多尺度融合深度图像增强方法及装置。本发明包括:(1)通过双分支逐步融合的方案,使RGB图像和深度图像输入可以在深度预测中相互补充,用深度确保图像大体结构完整,用彩色填充缺失像素值;(2)通过分析真实数据的噪声分布,设计了一种混合多尺度损失函数,保证即使在真实图像数据有噪声的情况下,高质量的清晰图像仍旧可以生成。本发明能够合理利用RGB图像和深度图像各自的特征,确保彩色图像所得到的特征信息对深度图像的修复起到辅助作用,最终预测完整的深度图像,显著提高了深度图像的质量。
-
公开(公告)号:CN109740682B
公开(公告)日:2020-07-28
申请号:CN201910016055.4
申请日:2019-01-08
Applicant: 南京大学
Abstract: 本发明公开了一种基于域转化和生成模型的图像识别方法,包括以下步骤:步骤1:构造从源域到目标域的转换模型;步骤2:构造从目标域到源域的转换模型;步骤3:构造二分类判别模型;步骤4:构造生成器;步骤5:构造分类类别为K+1的分类模型,K为类别数目;步骤6:根据步骤1,2,3,4,5得到基于源域和目标域的分类模型;步骤7:根据步骤6中得到的模型就可以得到待分类图像的分类结果。
-
公开(公告)号:CN111105350A
公开(公告)日:2020-05-05
申请号:CN201911165281.5
申请日:2019-11-25
Applicant: 南京大学
Abstract: 本发明提供了大视差场景下基于自身单应性变换的实时视频拼接方法,本发明非常适用于大视差场景下的视频拼接,因为视差会造成两路视频中前景和背景位移明显,该方法将前景和背景先分别拼接好,再前景和背景拼接结果融合,可以有效避免重影和错位,提升视频拼接效果;且如果待拼接视频当前帧只含背景时,背景通常是静止不动的,则可以提取出一个拼接模板。对于后续只含背景的帧,直接采用该模板拼接,压缩计算量加快拼接速度。
-
-
公开(公告)号:CN109740682A
公开(公告)日:2019-05-10
申请号:CN201910016055.4
申请日:2019-01-08
Applicant: 南京大学
Abstract: 本发明公开了一种基于域转化和生成模型的图像识别方法,包括以下步骤:步骤1:构造从源域到目标域的转换模型;步骤2:构造从目标域到源域的转换模型;步骤3:构造二分类判别模型;步骤4:构造生成器;步骤5:构造分类类别为K+1的分类模型,K为类别数目;步骤6:根据步骤1,2,3,4,5得到基于源域和目标域的分类模型;步骤7:根据步骤6中得到的模型就可以得到待分类图像的分类结果。
-
公开(公告)号:CN105913377B
公开(公告)日:2018-10-16
申请号:CN201610172203.8
申请日:2016-03-24
Applicant: 南京大学
Abstract: 本发明公开了一种保留图片相关性信息的图片拼接方法,包括以下步骤:步骤1,相关性分析:采集待拼接的图片得到图片集,并使每张图片获得一个类标签,再由t分布随机领域嵌入方法t‑SNE方法将图片的相关性信息嵌入到初始展示面板分布中,得到t‑SNE分布结果;步骤2,初始化展示面板子区域;步骤3,展示面板子区域划分:结合子区域优化及错误位置校正方法,确定每幅图片的朝向角θ、摆放位置、缩放尺度,并保证图片的相关性信息不被丢失;步骤4,无缝混合渲染:基于概率混合模型对展示面板子区域之间的边界区域进行无缝混合渲染,从而完成图片集中图片的剪切拼接。
-
公开(公告)号:CN108389181A
公开(公告)日:2018-08-10
申请号:CN201810063526.2
申请日:2018-01-23
Applicant: 南京大学
Abstract: 本发明公开了一种基于深度学习和法向图的零件缺陷检测和定位方法,包括以下步骤:步骤1:采集原始图像并计算得到材质表面法向图;步骤2:对表面法向图进行网格划分;步骤3:用具有不同缺陷的零件划分后的法向图以及正常零件划分后的法向图训练模型;步骤4:采集待检测零件图像并计算材质表面法向图;步骤5:对待检测零件的法向图进行网格划分;步骤6:根据步骤3得到的训练好的模型用步骤5得到的划分后的图像作为输入进行缺陷检测;步骤7:根据步骤6的检测结果以及步骤5的划分结果进行反馈和定位缺陷位置。
-
-
-
-
-
-
-
-
-