-
公开(公告)号:CN111598167A
公开(公告)日:2020-08-28
申请号:CN202010418929.1
申请日:2020-05-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种基于图学习的小样本图像识别方法及系统,所述图像识别方法包括:获取源域样本图像数据集;以各样本图像作为节点,建立无向带权图;基于特征生成模型提取各样本图像的基础特征向量;对各节点之间执行信息的传递和聚合,得到优化特征向量;基于优化特征向量,建立图像识别模型;根据所述优化特征向量,建立对比损失函数;采用随机梯度下降方法优化图像识别模型的参数直到对比损失函数收敛,以确定面向小样本图像的识别模型;根据面向小样本图像的识别模型,确定待测样本图像的所属类别。通过学习出来的识别模型在小样本场景下可以放大异类样本的类间差异,缩小同类样本的类内差异,极大提升了小样本识别的准确率。
-
公开(公告)号:CN108664902B
公开(公告)日:2020-08-25
申请号:CN201810367098.2
申请日:2018-04-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及视频分类领域,提出了一种基于深度学习的端到端的视频拷贝检测方法,旨在解决在视频拷贝检测中,两段视频中存在多处拷贝片段的检测困难,及无法准确定位拷贝视频片段的位置等问题。该方法的具体实施方式包括:对用于进行视频拷贝检测的两段待检测视频进行镜头分割以选取关键帧;利用预先构建的拷贝关系识别模型对所选取出的多个关键帧进行识别,确定各关键帧之间的拷贝关系;根据所得到的各关键帧之间的拷贝关系,构建两段上述待检测视频全部关键帧的贝关系矩阵;将该拷贝关系矩阵作为预先构建的定位识别模型的输入,定位两段所述待检测视中含有拷贝关系的片段。本发明能够快捷、高效地检测出两段视频中存在的多处拷贝关系的视频片段。
-
公开(公告)号:CN110321366A
公开(公告)日:2019-10-11
申请号:CN201910566988.0
申请日:2019-06-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/2455 , G06F16/2458 , G06F9/50
Abstract: 本发明涉及一种基于在线学习的统计量确定方法及系统,所述统计量确定方法包括:实时获取当前t时刻来自客户端的待处理数据,并确定待处理数据的类型;预先设定合格检验标准及可靠检验标准;筛选出合格数据;调取(t-1)时刻统计量;根据合格数据及(t-1)时刻统计量,确定t时刻统计量;检测当前待处理数据是否可靠,如果可靠,则删除合格数据,t时刻统计量为时刻t的终值统计量;否则根据t时刻统计量及合格数据,计算出不包含合格数据的统计量,确定t时刻的终值统计量;存储时刻t的终值统计量。本发明根据同时符合合格标准及可靠标准的数据更新统计量,并删除所述数据,避免数据占用大量内容,同时更新统计量与数据存储无关,提高统计量的更新速度。
-
公开(公告)号:CN104361059B
公开(公告)日:2018-03-27
申请号:CN201410609728.4
申请日:2014-11-03
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于多示例学习的网页分类方法,该方法包括:设计了相对大小排序前向比较法来提取网页内有效图像,并根据网页树状结构提取有效图像的相关文本;将一幅有效图像及其相关文本作为网页包中的一个示例,分别采用图像词包模型和文本词包模型生成有效图像及其相关文本的描述,并将二者合并起来作为示例的描述;采用多示例核对毒品网页进行分类。本发明的方法,通过将网页中内含的图像及其相关文本作为网页包中的示例,使算法更符合网页内容的实际分布,并能够充分利用网页的有效信息,深入挖掘图像信息与文本信息的互补性,最终取得比只利用单模态信息进行分类更好的效果。
-
公开(公告)号:CN107027051A
公开(公告)日:2017-08-08
申请号:CN201610596600.8
申请日:2016-07-26
Applicant: 中国科学院自动化研究所
IPC: H04N21/234 , H04N21/44
Abstract: 本发明公开了一种基于线性动态系统的视频关键帧提取方法,该方法包括以下步骤:步骤1,收集待处理的视频数据文件;步骤2,初始化一个视频片段,计算所述视频片段的线性动态系统模型参数,根据模型参数计算视频片段的重构误差;步骤3,逐帧增加所述视频片段的长度,重复步骤2直到重构误差超过预设的阈值;步骤4,将最后确定的视频片段的中间帧作为该片段的关键帧;步骤5,在前一个视频片段后初始化下一个新的视频片段,重复步骤2至步骤4直到所述视频数据文件结束。本发明可以显著提高关键帧在语义内容上的描述能力,可以应用在互联网视频内容检索、敏感视频检测与过滤以及智能视频监控等业务中。
-
公开(公告)号:CN106529426A
公开(公告)日:2017-03-22
申请号:CN201610921854.2
申请日:2016-10-21
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00744 , G06K9/6256 , G06K9/6278
Abstract: 本发明涉及一种基于贝叶斯模型的视觉人体行为识别方法,该方法包括以下步骤:提取训练视频中的特征,形成对所述训练视频中人体行为的底层表达;从所述特征出发,构建分层贝叶斯模型,以提取所述训练视频中不同尺度下的人体行为模式,得到基于高层语义信息的人体行为表达;嵌入最大间隔机制,实现判别式的分层贝叶斯模型的学习;学习所述判别式的分层贝叶斯模型的参数,以确定所述参数。本发明还涉及一种通过本发明所述的方法学习而成的视觉人体行为识别器。本发明通过引入最大间隔机制到识别模型中,与之前的识别模型统一起来形成一个统一的判别式的分层贝叶斯模型,能够有效的应对复杂行为背景的情况,进而实现鲁棒的行为识别。
-
公开(公告)号:CN106228164A
公开(公告)日:2016-12-14
申请号:CN201610596607.X
申请日:2016-07-26
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/6215 , G06F16/71 , G06F16/783 , G06K9/4676 , G06K9/6218 , G06K9/6255
Abstract: 本发明公开了一种视频动态基元库的构建方法。该方法包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集的每个视频数据文件,提取三维时空局部特征;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算所有三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。本发明可以应用在互联网视频内容检索、敏感视频检测与过滤以及智能视频监控等业务中。
-
公开(公告)号:CN106204613A
公开(公告)日:2016-12-07
申请号:CN201610575854.1
申请日:2016-07-20
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明公开了一种基于低秩矩阵表示的图像前景物体检测方法及检测系统。其中,该方法包括提取待处理图像的特征,并利用特征聚类的方式对待处理图像进行子区域划分;接着计算每一子区域的特征均值,以获得子区域的特征表示,并将全部子区域的特征表示排列成矩阵,以获得待处理图像的特征矩阵;然后,利用低秩矩阵表示方法,将特征矩阵分解成低秩矩阵与稀疏矩阵;再针对稀疏矩阵的每一列计算l∞范数,以获得对应子区域的显著性值,并基于子区域的显著值来构成待处理图像的显著图;最后,对显著图进行自适应阈值划分,从而获得待处理图像的前景物体区域。通过本发明实施例解决了如何从前景和背景表观相似的图像中完整地检测前景物体的技术问题。
-
公开(公告)号:CN103473555B
公开(公告)日:2016-09-21
申请号:CN201310376618.3
申请日:2013-08-26
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于多视角多示例学习的恐怖视频识别方法,其包括:对训练视频集合中的视频提取视频镜头,并针对每个视频镜头选取情感代表帧和情感突变帧;对训练视频集合中每个视频镜头提取音频和视觉特征,其中视觉特征基于所提取的情感代表帧和情感突变帧提取;对于每一个视频提取其四个视角特征向量,构成训练视频集合的多视角特征集合;对所得到的训练视频集合对应的多视角特征集合和待识别视频的多视角特征向量进行稀疏重构,得到稀疏重构系数;根据所述稀疏重构系数计算待识别视频的多视角特征向量与训练视频集合中恐怖视频集合与非恐怖视频集合分别对应的多视频特征集合的重构误差,进而确定待识别视频是否为恐怖视频。
-
公开(公告)号:CN102831184B
公开(公告)日:2016-03-02
申请号:CN201210272225.3
申请日:2012-08-01
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种根据对社会事件的文字描述来预测社会情感的方法及系统,该方法包括构建社会情感语料库;对所述社会情感语料库中的每一个样本进行所述面向情感标签排序的文本特征选择以得到数值型特征向量,建立训练集;构建情感标签序列的概率模型;在情感标签序列上构建标情感签序列损失函数,通过优化该损失函数,得到社会情感预测模型;将描述社会事件的文本输入所述预测模型,得到与该社会事件相对应的情感标签排序,所述情感标签排序表示对该社会事件所预测的社会情感。本发明能够有效地、精确地、自动地预测社会公众对社会事件的情感反应。
-
-
-
-
-
-
-
-
-