-
公开(公告)号:CN118135290A
公开(公告)日:2024-06-04
申请号:CN202410163900.1
申请日:2024-02-05
Applicant: 重庆邮电大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/30 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及基于transformer的细粒度图像分类方法。该方法包括以下步骤:S1:使用预处理模块处理原始图像数据集;S2:通过transformer主干网络将图像切分为互不重叠的小图块,并提取每个小图块的特征向量token,同时引入位置编码和class‑token;S3:使用信息丢弃模块对每个token进行打分,过滤掉得分较低的token;S4:通过特征选择模块从每层编码器的输出中筛选出强判别区域,将这些区域进行拼接得到聚合特征,再与class‑token融合;S5:使用分类预测模块对融合特征进行分类预测,构建交叉熵损失函数进行训练,通过不断更新参数和迭代训练,优化模型性能,直至模型收敛。