-
公开(公告)号:CN109271539A
公开(公告)日:2019-01-25
申请号:CN201811007151.4
申请日:2018-08-31
Applicant: 华中科技大学
IPC: G06F16/51 , G06F16/58 , G06F16/583 , G06K9/62
CPC classification number: G06K9/6267 , G06K9/629
Abstract: 本发明公开了一种基于深度学习的图像自动标注方法及装置,包括:利用深度学习技术提取待标注图像的视觉特征;利用图像库构建待标注图像的候选标签集,并利用深度学习技术从待标注图像的候选标签集中提取待标注图像的语义特征;融合待标注图像的视觉特征和语义特征以得到待标注图像的高层特征;根据待标注图像的高层特征,利用深度学习技术计算图像库中各标签在标注待标注图像时的概率;根据待标注图像的高层特征,利用深度学习技术预测待标注图像所需的标签个数;根据所计算的标签概率和所预测的标签个数,利用概率最高的前N个标签对待标注图像进行标注;本发明能够建立低层特征和高层语义标签之间的联系,从而提升图像标注的准确度。
-
公开(公告)号:CN109271539B
公开(公告)日:2020-11-24
申请号:CN201811007151.4
申请日:2018-08-31
Applicant: 华中科技大学
IPC: G06F16/51 , G06F16/58 , G06F16/583 , G06K9/62
Abstract: 本发明公开了一种基于深度学习的图像自动标注方法及装置,包括:利用深度学习技术提取待标注图像的视觉特征;利用图像库构建待标注图像的候选标签集,并利用深度学习技术从待标注图像的候选标签集中提取待标注图像的语义特征;融合待标注图像的视觉特征和语义特征以得到待标注图像的高层特征;根据待标注图像的高层特征,利用深度学习技术计算图像库中各标签在标注待标注图像时的概率;根据待标注图像的高层特征,利用深度学习技术预测待标注图像所需的标签个数;根据所计算的标签概率和所预测的标签个数,利用概率最高的前N个标签对待标注图像进行标注;本发明能够建立低层特征和高层语义标签之间的联系,从而提升图像标注的准确度。
-
公开(公告)号:CN113190699B
公开(公告)日:2023-04-18
申请号:CN202110528115.8
申请日:2021-05-14
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于类别级语义哈希的遥感图像检索方法及装置,属于遥感图像检索领域,方法为:将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中,计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离;按照汉明距离从小到大的顺序排序,输出前h个排名的检索结果;h为正整数;训练基于深度度量的类别级语义哈希网络模型的方法为:以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对基于深度度量的类别级语义哈希网络模型进行训练。实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持,在保证高检索效率低存储空间的同时提升检索准确率。
-
公开(公告)号:CN113192030B
公开(公告)日:2022-05-13
申请号:CN202110475173.9
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供一种遥感图像描述生成方法及系统,包括:利用深度学习技术提取待描述遥感图像的多层次视觉特征;基于待描述遥感图像的多层次视觉特征,利用空间注意力机制和通道注意力机制得到待描述遥感图像的多级特征;基于待描述遥感图像的多层次视觉特征,利用上下文注意力模块得到待描述遥感图像的上下文特征;基于待描述遥感图像的多级特征和上下文特征,利用视觉哨兵自适应机制得到待描述遥感图像的高级语义特征;将待描述遥感图像的高级语义特征输入到训练好的语言模型,得到待描述遥感图像的描述语句。本发明能够获得具有尺度、位置、上下文信息的视觉特征表达,从而提高遥感图像描述生成模型的准确性。
-
公开(公告)号:CN113192030A
公开(公告)日:2021-07-30
申请号:CN202110475173.9
申请日:2021-04-29
Applicant: 华中科技大学
Abstract: 本发明提供一种遥感图像描述生成方法及系统,包括:利用深度学习技术提取待描述遥感图像的多层次视觉特征;基于待描述遥感图像的多层次视觉特征,利用空间注意力机制和通道注意力机制得到待描述遥感图像的多级特征;基于待描述遥感图像的多层次视觉特征,利用上下文注意力模块得到待描述遥感图像的上下文特征;基于待描述遥感图像的多级特征和上下文特征,利用视觉哨兵自适应机制得到待描述遥感图像的高级语义特征;将待描述遥感图像的高级语义特征输入到训练好的语言模型,得到待描述遥感图像的描述语句。本发明能够获得具有尺度、位置、上下文信息的视觉特征表达,从而提高遥感图像描述生成模型的准确性。
-
公开(公告)号:CN113190699A
公开(公告)日:2021-07-30
申请号:CN202110528115.8
申请日:2021-05-14
Applicant: 华中科技大学
Abstract: 本发明提供了一种基于类别级语义哈希的遥感图像检索方法及装置,属于遥感图像检索领域,方法为:将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中,计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离;按照汉明距离从小到大的顺序排序,输出前h个排名的检索结果;h为正整数;训练基于深度度量的类别级语义哈希网络模型的方法为:以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对基于深度度量的类别级语义哈希网络模型进行训练。实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持,在保证高检索效率低存储空间的同时提升检索准确率。
-
-
-
-
-