-
公开(公告)号:CN115908828B
公开(公告)日:2024-08-16
申请号:CN202211415263.X
申请日:2022-11-11
Applicant: 苏州大学
IPC: G06V10/32 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像描述技术领域,尤其是指一种图像描述生成方法及装置。本发明所述的图像描述生成方法,通过局部通道注意力计算图像各个通道的权重,关注不同布纹之间的底层特征差异,从而提升网络的表征能力;通过全局通道注意力将局部通道注意力所提取的特征进行更好的融合。此外,本发明将通道注意力结构进行堆叠,局部邻域向全局进行扩散,局部特征与全局相关性结合,以提取图像局部与全局特征间以及特征通道间依赖关系,从而获得图像的上下文信息,有利于生成更精确的描述。该模块能够减少冗余特征并抑制与任务无关特征的干扰,使得网络高效的利用于生成描述强相关的特征,得到更加准确、质量更高的布纹图像描述。
-
公开(公告)号:CN115908828A
公开(公告)日:2023-04-04
申请号:CN202211415263.X
申请日:2022-11-11
Applicant: 苏州大学
IPC: G06V10/32 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像描述技术领域,尤其是指一种图像描述生成方法及装置。本发明所述的图像描述生成方法,通过局部通道注意力计算图像各个通道的权重,关注不同布纹之间的底层特征差异,从而提升网络的表征能力;通过全局通道注意力将局部通道注意力所提取的特征进行更好的融合。此外,本发明将通道注意力结构进行堆叠,局部邻域向全局进行扩散,局部特征与全局相关性结合,以提取图像局部与全局特征间以及特征通道间依赖关系,从而获得图像的上下文信息,有利于生成更精确的描述。该模块能够减少冗余特征并抑制与任务无关特征的干扰,使得网络高效的利用于生成描述强相关的特征,得到更加准确、质量更高的布纹图像描述。
-