-
公开(公告)号:CN119942112A
公开(公告)日:2025-05-06
申请号:CN202510000599.7
申请日:2025-01-02
Applicant: 电子科技大学
IPC: G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/0895 , G06V20/70
Abstract: 本发明公开一种图像分割大模型、预训练方法及相关装置,应用于图像识别技术,针对现有的基于深度学习的图像分割模型对大规模标注数据的依赖性和在小样本分割任务上的性能低的问题;本发明采用一种基于图像融合的伪分割方式,实现从大量无标注图像中的分割模型预训练,是通过以下技术方案来实现的:首先通过卷积和Transformer并行模块建立图像分割网络结构DCT‑Net,然后在无标注数据集中通过双视角数据增广得到待融合的训练图像对,接着对增广后的图像利用分块离散融合系数进行融合,得到融合后的图像。在此基础上将融合后的图像作为模型输入,融合系数图作为分割目标,建立伪分割任务对分割模型进行预训练。经过预训练后的模型在下游分割任务中,利用少量标注图像进行微调。本发明能克服传统基于深度学习的图像分割模型所需的标注成本高昂、小样本训练集上分割性能差的问题,可以有效降低模型所需标注量,并且提高其收敛速度和分割性能。