-
公开(公告)号:CN119919634A
公开(公告)日:2025-05-02
申请号:CN202411980224.3
申请日:2024-12-31
Applicant: 厦门大学
IPC: G06V10/25 , G06V10/22 , G06V10/764 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/096
Abstract: 一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品,属于计算机视觉技术领域,该方法利用上下文信息,检测出训练集中没有出现的过的新的类别的物体,包括如下步骤:利用主干特征提取网络对图像进行特征提取得到特征图;区域建议网络在特征图中生成一组候选框,对所有候选框应用候选框拓展模块,得到扩展框;利用蒸馏模块从CLIP图像编码器中学习知识得到蒸馏损失;将候选框和扩展框提取的特征和文本特征输入多目标分类模块中,得到分类损失;结合蒸馏损失和分类损失对模型进行训练;最后,将待检测的图片输入到训练后的模型中,生成预测的目标区域和对应的类别名称及对应的置信度,以此实现更精准的开放词汇目标检测。