-
公开(公告)号:CN108764107A
公开(公告)日:2018-11-06
申请号:CN201810499463.5
申请日:2018-05-23
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00362 , G06N3/0454 , G06N3/049
Abstract: 本发明涉及视觉识别领域,提出一种基于人体骨架序列的行为和身份联合识别方法,旨在解决在人体数据识别中,不能同时对身份信息和行为动作识别问题。该方法包括:获取待识别人体的人体骨架序列;根据人体骨架序列,利用预先构建的识别模型识别人体的身份信息和行为动作;其中,识别模型的训练方法:将训练用人体骨架序列的坐标转换到参考坐标系下,得到参考骨架序列;对参考骨架序列的各参考骨架的各关节节点坐标与预先指定的中心点的坐标比较,得到各参考骨架的各关节节点的相对坐标;对参考骨架序列进行三维坐标变换,对初始的识别模型进行训练,得到优化后的识别模型。本发明可以快速、准确的从人体骨架序列中识别出人体的身份信息和行为动作。
-
公开(公告)号:CN108446404A
公开(公告)日:2018-08-24
申请号:CN201810287528.X
申请日:2018-03-30
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F16/3344 , G06F16/3329
Abstract: 本发明属于模式识别领域,具体涉及一种面向无约束视觉问答指向问题的检索方法及系统。旨在解决无候选答案时的视觉问答指向问题。该方法主要包括:利用图像似物性采样的方法生成一定数目的候选答案,提取问句的文本特征和候选答案的视觉特征,把文本特征和视觉特征映射到同一共同特征空间中,然后计算共同特征空间中问句与候选答案的余弦相似度,把与文本特征余弦相似度最高的候选答案视为预测的正确答案。本方法利用成对的排序损失函数建立问句特征与候选答案特征的相关关系,同时针对无候选答案的问题,使用图像似物性采样的方法生成一定数目的候选的答案,为无候选区域的视觉问答提供了一种可行的解决方案。
-
公开(公告)号:CN104363981B
公开(公告)日:2018-06-05
申请号:CN201480000558.8
申请日:2014-07-14
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/80
Abstract: 本发明涉及一种人脸验证方法和系统,方法包括:利用主成分分析和线性判别分析对高维人脸特征数据分别进行预处理,其中包括设置主成分分析降维后的数据维度;建立判别式高阶玻尔兹曼机,设置隐含层的节点数;利用张量对角化的策略来减少该判别式高阶玻尔兹曼机的模型参数;把成对的人脸数据输入到判别式高阶玻尔兹曼机中,利用随机梯度下降算法来最大化关系类别的条件概率,从而迭代地优化该玻尔兹曼机的权重,从而得到最终的判别式高阶玻尔兹曼机;向判别式高阶玻尔兹曼机模型输入待验证的成对人脸数据,得到对应的验证结果数据。本发明通过在无监督玻尔兹曼机模型中引入数据关系类别信息,使模型判别力增强,更适于具有精度要求的人脸验证。
-
公开(公告)号:CN107704924A
公开(公告)日:2018-02-16
申请号:CN201610602678.6
申请日:2016-07-27
Applicant: 中国科学院自动化研究所
IPC: G06N3/08
Abstract: 本发明公开了针对序列的同步自适应时空特征表达学习模型的构建方法及其相关的模型分析方法和行为识别方法。其中,该构建法包括首先将长短时记忆神经元输入及三个控制门的全连接替换为四组独立的滤波器,依次构建卷积递归神经元;然后,将X个CRN并行排列,构建卷积递归神经网络层;接着根据以下方式构建隐含层:各CRN的输出只存在向其自身基本单元的反馈连接,且各CRN之间不存在连接关系;再在卷积递归神经网络层和输入序列之间构建卷积层;最后,将Y个卷积递归神经网络层相堆叠,形成卷积递归神经网络,单个卷积递归神经网络层包含Z个子层。通过本发明实施例可以获取更具区分性的序列时空信息表达,而且无需复杂的预处理。
-
公开(公告)号:CN103559510B
公开(公告)日:2017-01-18
申请号:CN201310562450.5
申请日:2013-11-12
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开了一种利用相关主题模型识别社会群体行为的方法,该方法包括以下步骤:利用相关主题模型对视频数据集中的视频进行建模;基于相关主题模型和视频训练集得到优化目标函数;在使得优化目标函数最大的情况下计算相关主题模型中的各个参数,训练得到包括分类器的相关主题模型;将视频测试集中测试视频的词袋表示输入到相关主题模型中,利用隐含单元对可见单元的条件概率推断得到测试视频的主题表示;将测试视频的主题表示送入分类器中,得到对于相应测试视频最后的识别结果。本发明能够提取出更具区分力的稀疏相关主题表示来弥补低层视频特征和类别标签之间的语义鸿沟,同时在缺乏标签数据的情况下仍然能够达到很好的识别性能。
-
公开(公告)号:CN106056043A
公开(公告)日:2016-10-26
申请号:CN201610339756.8
申请日:2016-05-19
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00771 , G06K9/6269
Abstract: 本发明提出了一种基于迁移学习的目标动物行为识别方法和装置,即训练数据集中的训练样本包括人的行为样本、非目标动物的行为样本和目标动物的行为样本中的一种或几种的组合,测试数据集为目标动物的行为样本。该发明步骤包括:步骤101,针对训练数据集中的每一个训练样本和测试数据集中的每一测试样本,提取原始特征;步骤102,采用迁移学习中的领域适应学习法将所述原始特征映射到共同空间中,得到新的特征;步骤103,利用所述新的特征训练SVM分类器,得到行为识别模型,同时对所述目标动物行为识别模型进行测试;步骤104,利用所述动物行为识别模型对目标动物的待识别行为进行识别。本发明提出的基于迁移学习的行为识别方法能有效的识别动物的行为。
-
公开(公告)号:CN103440504B
公开(公告)日:2016-08-17
申请号:CN201310418307.9
申请日:2013-09-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于结构先验知识的鲁棒生物特征识别方法,该方法包括:收集图像数据形成训练样本集和测试样本集;提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X;基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每一测试样本对应的重构系数向量;基于所述字典矩阵X,使用与所述测试样本集中的每一测试样本对应的重构系数向量进行样本重构,得到与每一测试样本对应的分属于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的类别即为所述测试样本的类别。本发明可以用在人脸识别等生物特征识别领域,能够有效处理存在遮挡噪声情况下的识别分类问题。
-
公开(公告)号:CN103279581B
公开(公告)日:2016-08-17
申请号:CN201310255896.3
申请日:2013-06-25
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。
-
公开(公告)号:CN103077404B
公开(公告)日:2016-07-06
申请号:CN201210593857.X
申请日:2012-12-31
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于马尔可夫随机场的局部增量式可视化聚类方法,主要包括迭代和处理两个过程,其中:对完全未知的目标数据计算其相异度矩阵,将该矩阵作为迭代过程的输入,得到k阶邻域系统和忠实度矩阵;将迭代过程的输出作为处理过程的输入,得到重排序图像和聚类置信度等信息。该方法根据马尔可夫随机场的性质,采用k阶邻域系统计算全局概率测度;根据k阶邻域系统,通过降维来降低计算复杂度;根据忠实度矩阵,选择最佳划分类别,并且进一步给出聚类结果的置信度。该方法为聚类提供先验信息,直观地了解数据结构和数据类别的分布情况;同时,还能一次即可给出聚类结果和聚类评估;并给出数据隐含复杂结构和聚类置信度。
-
公开(公告)号:CN103530689B
公开(公告)日:2016-01-20
申请号:CN201310530626.9
申请日:2013-10-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于深度学习的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。
-
-
-
-
-
-
-
-
-