-
公开(公告)号:CN112199532A
公开(公告)日:2021-01-08
申请号:CN202010906456.X
申请日:2020-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/532 , G06F16/55 , G06F16/583 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于哈希编码和图注意力机制的零样本图像检索方法及装置。该方法包括:构建哈希网络和关系网络;基于软边距的分类损失对哈希网络和关系网络进行训练;将数据库中的每一张图像输入到训练完成的哈希网络中,得到对应的图像哈希码;将待查询图像输入到训练完成的哈希网络中生成哈希码,计算其与数据库中每一张图像的哈希码之间的距离,并根据距离返回满足要求的查询结果。本发明能够同时考虑语义和视觉信息,充分挖掘类别之间的相似关系,从而更好地实现知识迁移,同时基于软边距的分类损失进行哈希学习能够在一定程度上避免对可见类别过拟合学习,提升模型对未见类别的泛化能力,进而提高零样本图像检索的效果。
-
公开(公告)号:CN112199532B
公开(公告)日:2022-10-14
申请号:CN202010906456.X
申请日:2020-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/532 , G06F16/55 , G06F16/583 , G06V10/74 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于哈希编码和图注意力机制的零样本图像检索方法及装置。该方法包括:构建哈希网络和关系网络;基于软边距的分类损失对哈希网络和关系网络进行训练;将数据库中的每一张图像输入到训练完成的哈希网络中,得到对应的图像哈希码;将待查询图像输入到训练完成的哈希网络中生成哈希码,计算其与数据库中每一张图像的哈希码之间的距离,并根据距离返回满足要求的查询结果。本发明能够同时考虑语义和视觉信息,充分挖掘类别之间的相似关系,从而更好地实现知识迁移,同时基于软边距的分类损失进行哈希学习能够在一定程度上避免对可见类别过拟合学习,提升模型对未见类别的泛化能力,进而提高零样本图像检索的效果。
-