-
公开(公告)号:CN112966135B
公开(公告)日:2022-03-29
申请号:CN202110160697.9
申请日:2021-02-05
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于注意力机制和门控机制的图文检索方法和系统,属于跨模态检索领域。本发明通过注意力机制快速筛选出有价值的信息,以获取更加精确的特征表达,在此基础上,为了使模态之间的对应关系更加显著,通过将两种模态的数据互相作为监督信息,并引入门控机制对另一模态特征进行进一步的调整,以尽可能多地过滤掉不必要的信息,保留语义丰富的部分,最终获得具有足够通用语义和准确注意力的图像特征,从而有效地提高跨模态检索模型的性能。
-
公开(公告)号:CN113220915B
公开(公告)日:2022-11-22
申请号:CN202110477016.1
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于残差注意力的遥感图像检索方法及装置,属于图像处理领域,方法包括:将待检索遥感图像输入至训练完毕的深度神经网络,根据正样本排名为正样本对应的三元组分配不同的惩罚权重;将各单元中的惩罚权重与正样本的检索分数相乘后求和,输出检索结果;训练深度神经网络的方法为:通过深度神经网络提取高层语义特征;通过残差注意力机制为局部特征分配注意力分数后,将全局特征和带有注意力分数的局部特征通过残差映射,获取更新后的特征集合;将更新后的特征集合通过特征描述符池化;将输出特征分划分为正样本和负样本后,采用动态加权机制,结合三元组损失函数训练深度神经网络。本发明有效提高了图像检索装置的性能。
-
公开(公告)号:CN113220915A
公开(公告)日:2021-08-06
申请号:CN202110477016.1
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于残差注意力的遥感图像检索方法及装置,属于图像处理领域,方法包括:将待检索遥感图像输入至训练完毕的深度神经网络,根据正样本排名为正样本对应的三元组分配不同的惩罚权重;将各单元中的惩罚权重与正样本的检索分数相乘后求和,输出检索结果;训练深度神经网络的方法为:通过深度神经网络提取高层语义特征;通过残差注意力机制为局部特征分配注意力分数后,将全局特征和带有注意力分数的局部特征通过残差映射,获取更新后的特征集合;将更新后的特征集合通过特征描述符池化;将输出特征分划分为正样本和负样本后,采用动态加权机制,结合三元组损失函数训练深度神经网络。本发明有效提高了图像检索装置的性能。
-
公开(公告)号:CN113190699B
公开(公告)日:2023-04-18
申请号:CN202110528115.8
申请日:2021-05-14
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于类别级语义哈希的遥感图像检索方法及装置,属于遥感图像检索领域,方法为:将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中,计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离;按照汉明距离从小到大的顺序排序,输出前h个排名的检索结果;h为正整数;训练基于深度度量的类别级语义哈希网络模型的方法为:以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对基于深度度量的类别级语义哈希网络模型进行训练。实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持,在保证高检索效率低存储空间的同时提升检索准确率。
-
公开(公告)号:CN113192030B
公开(公告)日:2022-05-13
申请号:CN202110475173.9
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供一种遥感图像描述生成方法及系统,包括:利用深度学习技术提取待描述遥感图像的多层次视觉特征;基于待描述遥感图像的多层次视觉特征,利用空间注意力机制和通道注意力机制得到待描述遥感图像的多级特征;基于待描述遥感图像的多层次视觉特征,利用上下文注意力模块得到待描述遥感图像的上下文特征;基于待描述遥感图像的多级特征和上下文特征,利用视觉哨兵自适应机制得到待描述遥感图像的高级语义特征;将待描述遥感图像的高级语义特征输入到训练好的语言模型,得到待描述遥感图像的描述语句。本发明能够获得具有尺度、位置、上下文信息的视觉特征表达,从而提高遥感图像描述生成模型的准确性。
-
公开(公告)号:CN113192030A
公开(公告)日:2021-07-30
申请号:CN202110475173.9
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供一种遥感图像描述生成方法及系统,包括:利用深度学习技术提取待描述遥感图像的多层次视觉特征;基于待描述遥感图像的多层次视觉特征,利用空间注意力机制和通道注意力机制得到待描述遥感图像的多级特征;基于待描述遥感图像的多层次视觉特征,利用上下文注意力模块得到待描述遥感图像的上下文特征;基于待描述遥感图像的多级特征和上下文特征,利用视觉哨兵自适应机制得到待描述遥感图像的高级语义特征;将待描述遥感图像的高级语义特征输入到训练好的语言模型,得到待描述遥感图像的描述语句。本发明能够获得具有尺度、位置、上下文信息的视觉特征表达,从而提高遥感图像描述生成模型的准确性。
-
公开(公告)号:CN113190699A
公开(公告)日:2021-07-30
申请号:CN202110528115.8
申请日:2021-05-14
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于类别级语义哈希的遥感图像检索方法及装置,属于遥感图像检索领域,方法为:将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中,计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离;按照汉明距离从小到大的顺序排序,输出前h个排名的检索结果;h为正整数;训练基于深度度量的类别级语义哈希网络模型的方法为:以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对基于深度度量的类别级语义哈希网络模型进行训练。实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持,在保证高检索效率低存储空间的同时提升检索准确率。
-
公开(公告)号:CN112966135A
公开(公告)日:2021-06-15
申请号:CN202110160697.9
申请日:2021-02-05
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于注意力机制和门控机制的图文检索方法和系统,属于跨模态检索领域。本发明通过注意力机制快速筛选出有价值的信息,以获取更加精确的特征表达,在此基础上,为了使模态之间的对应关系更加显著,通过将两种模态的数据互相作为监督信息,并引入门控机制对另一模态特征进行进一步的调整,以尽可能多地过滤掉不必要的信息,保留语义丰富的部分,最终获得具有足够通用语义和准确注意力的图像特征,从而有效地提高跨模态检索模型的性能。
-
-
-
-
-
-
-