-
公开(公告)号:CN118247561A
公开(公告)日:2024-06-25
申请号:CN202410365894.8
申请日:2024-03-28
Applicant: 哈尔滨工业大学
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明的一种基于多尺度注意力机制的新能源电池包图像分类方法及装置,基于多尺度注意力机制的CNN+Transformer架构(MSNET),对传统的基于CNN的图像分类方法进行了改进,提高了新能源电池包在类别间特征差异过小情况下的图像分类准确度;MSNET网络可以提取不同尺度下的局部信息,将局部结构信息整合到全局上下文信息中,提高特征识别能力,以缓解全局上下文信息不足问题。同时,为缓解参数量大,计算复杂度高等问题,本发明所提出的MSNET网络引入深度可分离卷积,在通道维度而不是空间维度执行自注意力,大幅度减少卷积参数及计算量,显著提高效率。