基于两阶段注意力定位框架的细粒度图像分类方法及系统

    公开(公告)号:CN118608829A

    公开(公告)日:2024-09-06

    申请号:CN202410652738.X

    申请日:2024-05-24

    Applicant: 重庆大学

    Abstract: 本发明公开了基于两阶段注意力定位框架的细粒度图像分类方法及系统,属于图像处理技术领域。方法包括:使用两种不同的划分模式处理图像,得到不重叠补丁序列和重叠的补丁序列,并分别对每个序列合并一个类令牌;第一阶段,不重叠补丁序列输入到基于Transformer编码器的特征提取器中以生成注意力分数和一个类令牌;第二阶段整合所有层的注意力分数,通过排序操作识别关键补丁位置,并提取这些位置上的重叠补丁序列作为复用特征提取器的输入,通过保留相邻区域的局部信息,以获取更精细的类令牌和图像特征;最终生成两个阶段的类令牌和最终的图像特征作为训练损失的组成部分。使用该方法便于提高细粒度图像分类精度。

Patent Agency Ranking