-
公开(公告)号:CN117036832A
公开(公告)日:2023-11-10
申请号:CN202311294085.4
申请日:2023-10-09
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/26 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于随机多尺度分块的图像分类方法、装置及介质,包括:根据随机数对图像进行可变大小的切割,得到不同大小的图像块并记录其在图像中的位置坐标以及图像块的大小信息,从而获取图像块在图像中的位置编码以及对每个图像块大小进行编码;从图像中提取不同大小的图像块并进行像素编码;将相同大小图像块的编码向量分别组合成序列;将不同大小的序列添加图像块大小编码后分别先后输入第一Transformer编码器模块和第二Transformer编码器模块获得全局特征,再进行层归一化之后进行线性变换,得到最终的图像预测类别。本发明具有多尺度特征提取能力和数据的多样性,提高图像分类的准确性和泛化能力,减轻过拟合问题,更好地学习到数据的统计特性。
-
公开(公告)号:CN117036832B
公开(公告)日:2024-01-05
申请号:CN202311294085.4
申请日:2023-10-09
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/26 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于随机多尺度分块的图像分类方法、装置及介质,包括:根据随机数对图像进行可变大小的切割,得到不同大小的图像块并记录其在图像中的位置坐标以及图像块的大小信息,从而获取图像块在图像中的位置编码以及对每个图像块大小进行编码;从图像中提取不同大小的图像块并进行像素编码;将相同大小图像块的编码向量分别组合成序列;将不同大小的序列添加图像块大小编码后分别先后输入第一Transformer编码器模块和第二Transformer编码器模块获得全局特征,再进行层归一化之后进行线性变换,得到最终的图像预测类别。本发明具有多尺度特征提取能力和数据的多样性,提
-