-
公开(公告)号:CN116416429A
公开(公告)日:2023-07-11
申请号:CN202310198997.5
申请日:2023-03-03
Applicant: 南京大学
Abstract: 一种扩大感受野的三维点云场景理解方法、设备及介质,构建线性大核类卷积算子LinK模块作为计算机视觉感知的卷积核,首先由三维点云场景得到体素数据进行特征提取,特征编码器由四个编码器层组成,每个编码器层包括一次降采样层、带残差的稀疏卷积模块和LinK模块,降采样后的特征并行送入带残差的稀疏卷积模块和LinK模块中,各编码器层所得特征相加得到体素特征,用于三维点云场景理解的下游任务,如语义分割或目标检测等。本发明能够与现有方法很好地融合,可以加入到任何基于稀疏卷积的3D场景理解的骨干网络中,实现三维点云场景理解任务中的感知范围扩大同时降低参数量,提升网络在多个下游任务上的性能。