-
公开(公告)号:CN103678709B
公开(公告)日:2017-02-22
申请号:CN201310746814.5
申请日:2013-12-30
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于时序数据的推荐系统攻击检测方法,包括:利用用户-项目偏好程度数据集和频繁项集挖掘技术,得到用户组和项目组;为每对用户组和项目组计算组偏好程度值比例特征;将项目组中各项目的所有偏好程度按操作时间形成时序的偏好程度数据;为每对的用户组和项目组计算组偏好程度时间间隔特征;为用户组计算组平均熵特征;为每一用户组,选择其对应最大的组偏好程度值比例特征和最大的组偏好程度时间间隔特征,并依次利用上述三种特征对用户组进行排序,得到三个有序的用户组序列;综合所述三个有序的用户组序列,得到一个整体有序的用户组序列,从而得到最可能的攻击用户组;通过组偏好程度值比例特征得到最有可能的目标项目组。
-
公开(公告)号:CN105205453A
公开(公告)日:2015-12-30
申请号:CN201510537480.X
申请日:2015-08-28
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00597 , G06K9/0061 , G06K9/66
Abstract: 本发明公开了一种用于人眼检测和定位的方法,包括:对带有标定好的人眼矩形框位置的训练集中的所有图像,利用人眼矩形框位置生成二值化的标签图;在图像上随机取小图像块,无监督地分层训练多个自编码器以构建深度自编码器,并利用自编码器中各层的权重对深度自编码器进行初始化;在原图像和标签图的相同位置上随机取小原图像块和小标签图像块,以小标签图像块作为监督信息,以小原图像块为输入,优化深度自编码器;在待测图像上以滑动窗口的方式生成多个小待测图像块,利用深度自编码器得到每个小待测图像块的小待测标签图像块并将其合并在一起,得到待测图像的待测标签图,对待测标签图进行二值化,利用坐标投影或寻找轮廓得到人眼的位置。
-
公开(公告)号:CN105184312A
公开(公告)日:2015-12-23
申请号:CN201510522970.2
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/6256 , G06K9/627 , G06N3/088
Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。
-
公开(公告)号:CN102930295B
公开(公告)日:2015-11-11
申请号:CN201210409976.5
申请日:2012-10-24
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 一种基于自适应空间信息有向图的图像分类方法,包括步骤:从所有图像中提取局部特征;根据每个局部特征对应的视觉单词,从测试图像中随机抽取局部特征分组;利用聚类算法对各组局部特征的空间坐标聚类,以聚类中心为定点并连接各相邻顶点得到空间信息的有向图;根据局部特征的空间位置,对所有图像进行类聚操作,将聚集结果串联得到图像的最终表达。本发明能够自适应地考虑不同视觉单词在空间分布上的差异性,从而能够更好地对全局空间信息进行建模,因而,能够有效地提升图像分类精度。
-
公开(公告)号:CN104992167A
公开(公告)日:2015-10-21
申请号:CN201510451034.7
申请日:2015-07-28
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
CPC classification number: G06K9/00228
Abstract: 本发明公开了一种基于卷积神经网络的人脸检测方法及装置。所述方法包括将训练集中的所有图片缩放成预定大小的灰度图,并为每个所述图片中的每个像素点赋予标签信息,所述标签信息用于表示其对应的像素点是否为人脸;建立卷积神经网络,其中,所述卷积神经网络各层依次为输入层、多个卷积层、多个全连接层和输出层;使用梯度下降法和反向传播算法训练所述卷积神经网络;将待检测照片输入至训练好的所述卷积神经网络中,得到最后一层的输出特征值;将所述最后一层的输出特征值与预定阈值进行比较,以确定所述待测照片中各像素点是否为人脸区域;使用最小闭包的方法,根据确定为人脸区域的各像素点检测出人脸的位置。
-
公开(公告)号:CN104834748A
公开(公告)日:2015-08-12
申请号:CN201510272498.1
申请日:2015-05-25
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30244 , G06K9/6229
Abstract: 本发明公开了一种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
-
公开(公告)号:CN104809107A
公开(公告)日:2015-07-29
申请号:CN201510253508.7
申请日:2015-05-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种基于上下文转换向量模型的推荐方法及系统,该推荐方法包括:步骤1,将上下文常用语义作用表示为一个上下文词典,将上下文表示为一个隐含向量表示,多个隐含向量表示形成隐含矩阵表示,隐含矩阵表示配合对应的权重向量生成特定属性的隐含向量表示;步骤2,基于步骤1中词典生成上下文度量转换子;步骤3,由步骤2中矩阵和用户、产品的隐含向量表示生成对应于特定环境的用户隐含向量表示和产品隐含向量表示;步骤4,由步骤3中的向量计算出预测值。本发明引入用户隐含向量表示、产品隐含向量表示、上下文集合的隐含矩阵表示,去除了原始向量空间中的一些“噪音”,获得比其他现有模型的预测更准确的效果。
-
公开(公告)号:CN102663447B
公开(公告)日:2014-04-23
申请号:CN201210133488.6
申请日:2012-04-28
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于判别相关分析的跨媒体检索方法,该方法包括以下步骤:建立跨媒体训练数据库,依次对其中不同模态样本进行特征提取、均值预处理和线性投影变换,并根据投影空间设定一目标函数;求解目标函数得到线性投影向量;建立跨媒体测试数据库;对待检索对象依次进行特征提取和均值预处理;使用所述线性投影向量对经均值预处理的特征数据进行线性投影变换;计算两模态数据投影变量之间的欧式距离,并进行升序排序,从而得到跨媒体检索结果。本发明方法能够对特征数据进行有效地降维,从而广泛地应用在其他很多多模态工作中,比如多模态生物特征识别。
-
公开(公告)号:CN103400143A
公开(公告)日:2013-11-20
申请号:CN201310293779.6
申请日:2013-07-12
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种基于多视角的数据子空间聚类方法,其包括:提取多视角数据库中的多视角特征;对于所述多视角数据库,选择特定的线性重构表示方法,并确定所述线性重构表示方法相对应的正则化约束方式;确定所述多视角特征中每个视角特征的重构误差权重;根据所选定的重构表示方法和所获得的不同视角特征的重构误差权重,学习得到对所述多视角数据库中所有样本进行重构的线性表示矩阵;所述线性表示矩阵用于表示数据库中样本之间的关系,元素值表示其所在行对应的样本重构其所在列对应样本的重构系数;将所述线性表示矩阵进行相应处理得到度量所述多视角数据库中样本相似性的亲和矩阵;利用谱聚类算法对所述亲和矩阵进行分割得到多视角数据子空间。
-
公开(公告)号:CN103258217A
公开(公告)日:2013-08-21
申请号:CN201310180039.1
申请日:2013-05-15
Applicant: 中国科学院自动化研究所
IPC: G06K9/66
Abstract: 本发明公开一种基于增量学习的行人检测方法,可以用于大数据背景下的行人检测等领域。此方法包括:步骤1、利用训练集中的图像样本训练分类器,得到初始的分类器;步骤2、利用新的训练集进行分类器的增量学习,得到更新后的分类器;步骤3、利用更新后的分类器对待测图像进行检测,得到行人检测结果。该方法能够在极短时间内,占用少量内存,利用大数据背景中陆续收集到的多个大型训练集有效地学习并更新分类器。相对于常规方法,该方法速度快、占用内存小、使用方便,并可以学习到与常规方法非常接近的分类效果。
-
-
-
-
-
-
-
-
-