-
公开(公告)号:CN113408577A
公开(公告)日:2021-09-17
申请号:CN202110517855.1
申请日:2021-05-12
Applicant: 桂林电子科技大学
Abstract: 本发明涉及图像数据处理领域,公开了一种基于注意力机制的图像分类方法,包括基于离散余弦变换对特征图每个通道进行频率分解并用多个频率分量联合表示通道全局信息,然后计算通道注意力权重信息;对特征图各通道基于权重信息加权得到通道注意力机制,然后计算特征图每个像素的空间注意力权重,再对特征图各空间像素加权求和,以得到空间注意力机制;将通道注意力机制和空间注意力机制嵌入到ResNet,得到图像分类卷积神经网络,并进行训练。本发明在通道注意力中将多个频率分量结合可以更好地表示通道的全局信息;在空间注意力中采用自注意力机制获取特征图空间维度上的全局信息,可以获得比传统卷积实现的空间注意力更优的空间权重分配。
-
公开(公告)号:CN113408575B
公开(公告)日:2022-08-19
申请号:CN202110517024.4
申请日:2021-05-12
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于判别性区域定位的图像数据增广方法,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;数据增广操作包括两种,其中区域裁剪是通过在判别性区域中随机采样一个正方形区域,并基于所述正方形区域对原始图像进行裁剪;区域混合是随机取两张不同类别的图片,分别求出两张图片的判别性区域掩膜,再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合;每轮迭代都由原始图像生成增广样本,并与下一轮迭代的原始图像一起组成下一轮迭代的训练样本,直至训练结束。本发明可以解决传统方法生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
-
公开(公告)号:CN113408575A
公开(公告)日:2021-09-17
申请号:CN202110517024.4
申请日:2021-05-12
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于判别性区域定位的图像数据增广方法,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;数据增广操作包括两种,其中区域裁剪是通过在判别性区域中随机采样一个正方形区域,并基于所述正方形区域对原始图像进行裁剪;区域混合是随机取两张不同类别的图片,分别求出两张图片的判别性区域掩膜,再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合;每轮迭代都由原始图像生成增广样本,并与下一轮迭代的原始图像一起组成下一轮迭代的训练样本,直至训练结束。本发明可以解决传统方法生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
-
-