-
公开(公告)号:CN118823429A
公开(公告)日:2024-10-22
申请号:CN202410788532.X
申请日:2024-06-18
Applicant: 鹏城实验室
IPC: G06V10/764 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0499 , G06N3/088 , G06N3/0895 , G06N3/09 , G06N3/096
Abstract: 本申请实施例公开一种图像分类模型训练方法、装置、设备及介质。通过确定出原始图像集中每个原始图像对应的至少两个视图,将视图确定为训练图像;获取每个训练图像的图像特征向量,根据图像特征向量确定图像分类模型对应的对比学习损失;将图像特征向量输入至图像分类模型中,输出每个训练图像的图像类别概率,根据图像类别概率和已标注训练图像的标签,确定图像分类模型对应的分类损失;根据图像类别概率在未标注训练图像中确定出目标训练图像;根据目标训练图像对应的图像类别概率,确定图像分类模型对应的局部熵正则化损失;根据对比学习损失、分类损失和局部熵正则化损失确定图像分类模型的模型损失,根据模型损失对图像分类模型迭代训练。
-
公开(公告)号:CN117274768A
公开(公告)日:2023-12-22
申请号:CN202310954725.3
申请日:2023-07-31
Applicant: 鹏城实验室
IPC: G06V10/82 , G06V10/764 , G06V10/25 , G06V10/26 , G06V10/42 , G06V10/44 , G06V20/70 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/084 , G06N3/0895
Abstract: 本申请公开了目标检测网络的训练方法、目标检测方法及相关装置,涉及计算机视觉中弱监督目标检测的技术领域。通过获取包括原始图像的训练数据集输入至包括分类器和定位器的目标检测网络,并生成自注意力图进而生成增强的掩码图像。将原始图像输入至定位器得到预测激活图像,计算与掩码图像的第一损失值。再获取边界框并对掩码图像进行采样得到增强图像并输入分类器得到预测分类结果,计算与原始图像的分类标签生成第二损失值。根据第一损失值和第二损失值调节目标检测网络的模型权重,直至达到迭代终止条件得到目标检测网络。由此设计分类器和定位器统一的网络架构,通过自注意力图和掩码图像以及增强图像,提升了定位和分类的精度进而性能。
-