-
公开(公告)号:CN120032163A
公开(公告)日:2025-05-23
申请号:CN202411989922.X
申请日:2024-12-31
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06V10/26 , G06V10/44 , G06V10/82 , G06V20/58
Abstract: 本发明公开了一种生成图像正样本实现图像分类的方法、系统、介质及设备,属于计算机视觉领域。本发明首先通过多模态模型提取并重写文本语义,增强视觉提示,进而引导去噪扩散模型生成与原始图像语义一致的正样本,并利用对比学习对图像编码器进行无监督训练,使其准确获取语义信息;使用有标签的特征向量训练线性分类器,从而构建出图像分类模型,用于图像分类任务,最终可以在无需大量标注数据的情况下完成图像类别判断。