一种基于视觉词袋模型的轻量化实例分割方法

    公开(公告)号:CN118506006A

    公开(公告)日:2024-08-16

    申请号:CN202410701311.4

    申请日:2024-05-31

    Abstract: 本发明提供一种基于视觉词袋模型的轻量化实例分割方法,能够充分提取图像中的特征并以此为基础引导网络生成相应实例掩码,能够得到更为良好的掩码预测效果。该方法的具体过程为:提取待分割的RGB图像的多尺度特征,所述多尺度特征包含高维度的语义特征信息和低维度的图像像素信息;将多尺度特征分别输入至锚点网格中,利用锚点网格不同比例的检测框做区域划分,再进行特征提取,并输出对应的掩码置信度;将多尺度特征中的低纬度特征输入至视觉词袋模型中,生成视觉单词并输入自注意力结构;将自注意力结构输出的视觉单词乘以相应的掩码置信度,得到每一分类下的掩码图像;利用非极大值抑制方法,筛选最佳的匹配位置后即可获取相应的实例分割结果。

Patent Agency Ranking