基于CLIP类别增量学习的图像分类方法及系统

    公开(公告)号:CN118506049A

    公开(公告)日:2024-08-16

    申请号:CN202410367548.3

    申请日:2024-03-28

    Applicant: 南开大学

    Abstract: 本发明公开一种基于CLIP类别增量学习的图像分类方法及系统,包括:构建预训练的CLIP模型,获取训练图像及对应的文本标签,分别采用图像编码器和文本编码器提取图像特征和文本特征,以对适配器进行训练;其中,根据新输入的训练图像的文本特征和旧类别文本特征的相似度,筛选相邻类别的新旧类别对,对每对相邻类别中的旧类别文本特征,采用正态分布进行采样,以此构建铰链损失函数;在完成第t个训练任务后,将前一训练任务的适配器参数与当前训练任务的适配器参数进行融合,从而得到当前训练任务的最终适配器参数;对待处理图像采用训练后的CLIP模型得到分类结果。减少由于学习新类而导致的旧类遗忘,提高图像分类准确度。

Patent Agency Ranking