图像分类到语义分割的跨任务知识蒸馏方法、装置及介质

    公开(公告)号:CN116681887A

    公开(公告)日:2023-09-01

    申请号:CN202310499648.7

    申请日:2023-05-05

    Abstract: 本发明公开了一种图像分类到语义分割的跨任务知识蒸馏方法、装置及介质,其中方法包括:对预训练大模型的结构进行重编码;针对预训练大模型的部分参数进行微调;将训练后的大模型中解码器的参数复制到学生模型的解码器;固定学生模型的解码器,利用预设的损失函数训练学生模型的骨干网络;缩小学习率,利用预设的损失函数,继续训练全部的学生模型,获得最终的语义分割模型,以用于语义分割。本发明解决了在计算资源受限的情况下,难以直接将大模型应用于下游任务的问题,可以使用较小的计算代价提升语义分割模型的性能。本发明可广泛应用于数据处理、模型压缩技术领域。

Patent Agency Ranking