基于transformer的细粒度图像分类方法

    公开(公告)号:CN118135290A

    公开(公告)日:2024-06-04

    申请号:CN202410163900.1

    申请日:2024-02-05

    Abstract: 本发明涉及基于transformer的细粒度图像分类方法。该方法包括以下步骤:S1:使用预处理模块处理原始图像数据集;S2:通过transformer主干网络将图像切分为互不重叠的小图块,并提取每个小图块的特征向量token,同时引入位置编码和class‑token;S3:使用信息丢弃模块对每个token进行打分,过滤掉得分较低的token;S4:通过特征选择模块从每层编码器的输出中筛选出强判别区域,将这些区域进行拼接得到聚合特征,再与class‑token融合;S5:使用分类预测模块对融合特征进行分类预测,构建交叉熵损失函数进行训练,通过不断更新参数和迭代训练,优化模型性能,直至模型收敛。

Patent Agency Ranking