一种基于动态采样的不平衡图片数据分类方法和装置

    公开(公告)号:CN116310498A

    公开(公告)日:2023-06-23

    申请号:CN202310060451.3

    申请日:2023-01-18

    Abstract: 本申请涉及一种基于动态采样的不平衡图片数据分类方法和装置,所述方法包括S1:手动创建不平衡图像数据;S2:对创建的不平衡图像数据进行归一化和独热编码,获得训练样本;S3:构建图片分类基础模型并冻结住模型;S4:利用f1‑score算法来动态的进行训练样本的采样;S5:解冻模型并利用f1‑score动态采样过的数据开始训练,然后根据混淆矩阵来输出损失结果和每个类型图像识别的准确率。本申请在训练过程之前会生成一个新的数据集来实现离线数据增强。生成的数据集足够大,可以保证有足够的样本在训练阶段对F1分数低的类进行重采样。与在线数据增强相比,离线数据增强具有易于阅读、方便后期实施调整以及生成可视化图像有助于控制增强图像等优点。

Patent Agency Ranking