-
公开(公告)号:CN116681887A
公开(公告)日:2023-09-01
申请号:CN202310499648.7
申请日:2023-05-05
Applicant: 华南理工大学
IPC: G06V10/26 , G06N3/045 , G06N3/08 , G06V10/764 , G06V10/82 , G06V10/774 , G06N5/02
Abstract: 本发明公开了一种图像分类到语义分割的跨任务知识蒸馏方法、装置及介质,其中方法包括:对预训练大模型的结构进行重编码;针对预训练大模型的部分参数进行微调;将训练后的大模型中解码器的参数复制到学生模型的解码器;固定学生模型的解码器,利用预设的损失函数训练学生模型的骨干网络;缩小学习率,利用预设的损失函数,继续训练全部的学生模型,获得最终的语义分割模型,以用于语义分割。本发明解决了在计算资源受限的情况下,难以直接将大模型应用于下游任务的问题,可以使用较小的计算代价提升语义分割模型的性能。本发明可广泛应用于数据处理、模型压缩技术领域。