一种利用基于深度语义排序哈希编码的图像检索方法

    公开(公告)号:CN104834748B

    公开(公告)日:2018-08-03

    申请号:CN201510272498.1

    申请日:2015-05-25

    Abstract: 本发明公开了种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。

    一种利用基于深度语义排序哈希编码的图像检索方法

    公开(公告)号:CN104834748A

    公开(公告)日:2015-08-12

    申请号:CN201510272498.1

    申请日:2015-05-25

    CPC classification number: G06F17/30244 G06K9/6229

    Abstract: 本发明公开了一种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。

    一种利用相关主题模型识别社会群体行为的方法

    公开(公告)号:CN103559510B

    公开(公告)日:2017-01-18

    申请号:CN201310562450.5

    申请日:2013-11-12

    Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。

    一种利用紧凑视频主题描述子进行视频检索的方法

    公开(公告)号:CN103279581B

    公开(公告)日:2016-08-17

    申请号:CN201310255896.3

    申请日:2013-06-25

    Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。

    一种利用相关主题模型识别社会群体行为的方法

    公开(公告)号:CN103559510A

    公开(公告)日:2014-02-05

    申请号:CN201310562450.5

    申请日:2013-11-12

    Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。

    一种利用紧凑视频主题描述子进行视频检索的方法

    公开(公告)号:CN103279581A

    公开(公告)日:2013-09-04

    申请号:CN201310255896.3

    申请日:2013-06-25

    Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。

Patent Agency Ranking