一种基于坐标注意力机制的图像分类模型

    公开(公告)号:CN119762854A

    公开(公告)日:2025-04-04

    申请号:CN202411815847.5

    申请日:2024-12-11

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于坐标注意力机制的图像分类模型,主要包括以下步骤:输入图像数据,进行图像化编码;注意力模块对张量形式的图像特征信息进行处理;图像特征张量经过归一化和非线性操作进行权重更新,利用YOLOV7算法中图像卷积和反卷积模型对图像数据补充和分类诊断,完成图像分类器的训练并生成图像分类模型。提供的注意力模块可以将编码信息推入到信道注意力及制造,避免过大的计算开销,解决算力不足的缺点;并且将信道注意力机制分为两个并行的一维特征编码过程有效地将空间上下文信息集成到生成的注意力图中以捕捉方向感和位置敏感的信息,使得注意力机制更容易插入到传统的移动网络中,也更能准确地定位和识别目标区域。

Patent Agency Ranking