-
公开(公告)号:CN117636345A
公开(公告)日:2024-03-01
申请号:CN202311352592.9
申请日:2023-10-18
Applicant: 北京邮电大学
IPC: G06V20/70 , G06V10/82 , G06V10/86 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 本公开提供一种视觉信息的处理方法、装置、电子设备和存储介质。涉及计算机视觉技术领域。上述方法包括:获取目标图像,以及多个视觉属性所对应的多个语义特征;通过视觉属性识别模型,执行如下识别视觉属性的操作:对所述多个语义特征进行关联,以确定同类别的语义特征存在的至少两个层级;提取所述目标图像的视觉特征;根据所述视觉特征和关联后的语义特征,识别所述目标图像是否存在所述至少两个层级的所述多个视觉属性。本公开可以对输入模型的语义特征进行层级化,以加强特征之间的联系,有助于提高基于特征的预测准确度。并且,本公开可以通过对预测结果进行层级化,丰富所预测的视觉属性信息,有助于让所预测的信息更加准确。