-
公开(公告)号:CN102043967A
公开(公告)日:2011-05-04
申请号:CN201010592894.X
申请日:2010-12-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种有效的运动目标行为建模与识别方法,包括步骤1:用特征提取模块提取运动目标行为的局部特征,再提取运动目标行为的运动特征;步骤2:采用子空间学习的方法,用特征融合模块对提取的局部特征和运动特征进行融合,并对特征空间进行降维;步骤3:采用原型学习算法和测度学习算法相结合,用行为识别模块对运动目标行为进行识别,对识别的运动目标行为做出评判。本发明对局部特征和运动特征进行特征融合处理,降低了特征空间的维度,提高了特征表达的鲁棒性,具有低存储和低计算复杂度的特点,同时具有较好的分类识别性能。本发明可以用来对公共安全领域的异常行为进行智能监控,一旦发现异常行为发生,立刻报警。
-
公开(公告)号:CN101470897B
公开(公告)日:2011-04-20
申请号:CN200710304206.3
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明是一种基于音视频融合策略的敏感视频检测方法,包括步骤:建立敏感声音的混合高斯模型,音频数据的分离、加窗、以及特征提取,敏感声音片段的定位及其敏感程度输出,敏感片断视频图像帧的检测,基于贝叶斯的音视频融合决策等。本发明结合了音频和视频两个模态的信息来过滤敏感视频,大大降低了采用单一模态可能出现的不确定性,显著提高了识别效率。本发明可以用来检测互联网上的视频流以及音像制品中是否包含敏感内容,亦可以用来对网络视频聊天室进行监控,一旦发现色情表演即进行阻断。
-
公开(公告)号:CN101751554A
公开(公告)日:2010-06-23
申请号:CN200810239326.4
申请日:2008-12-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种对互联网大麻图像进行的过滤方法,包括步骤:利用尺度不变特征变换算法提取图像的局部特征;对每一个大麻训练图像的每一个局部特征构造一个自相似性弱分类器;自相似性弱分类器考察任意一幅测试图像是否与此自相似性弱分类器的局部特征所在的大麻图像相似及自相似程度是否足够;如果一幅测试图像既与此自相似性弱分类器的局部特征所在的大麻图像相似,又有足够的自相似性;将自相似性弱分类器整合到一起,构造一个强分类器对一幅图像的所有局部特征判断此图像是否为大麻图像。本发明采用自相似性弱分类器,克服现有技术物体识别方法中无法考虑图像内部相似关系的缺点,从而有效地抓住大麻图像的特点。
-
公开(公告)号:CN101470897A
公开(公告)日:2009-07-01
申请号:CN200710304206.3
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06T7/00
Abstract: 本发明是一种基于音视频融合策略的敏感视频检测方法,包括步骤:建立敏感声音的混合高斯模型,音频数据的分离、加窗、以及特征提取,敏感声音片段的定位及其敏感程度输出,敏感片断视频图像帧的检测,基于贝叶斯的音视频融合决策等。本发明结合了音频和视频两个模态的信息来过滤敏感视频,大大降低了采用单一模态可能出现的不确定性,显著提高了识别效率。本发明可以用来检测互联网上的视频流以及音像制品中是否包含敏感内容,亦可以用来对网络视频聊天室进行监控,一旦发现色情表演即进行阻断。
-
公开(公告)号:CN1941850A
公开(公告)日:2007-04-04
申请号:CN200510108137.X
申请日:2005-09-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉技术领域,一种在多摄像机下基于主轴匹配的行人跟踪方法,包括步骤:对序列图像进行运动检测;提取人的主轴特征;进行单摄像机下的跟踪;依据主轴匹配函数建立主轴匹配对;融合多视角信息对跟踪结果进行优化更新。本发明提出了一种新型的多摄像机匹配技术,克服了传统多摄像机匹配方法需要定标、采用特征易受噪声与视角因素的影响、依赖于准确分割算法的缺点,具有很好的应用前景。
-
公开(公告)号:CN1508755A
公开(公告)日:2004-06-30
申请号:CN02157117.1
申请日:2002-12-17
Applicant: 中国科学院自动化研究所
Abstract: 一种敏感视频检测方法,包括步骤:选择关键视频帧;检测皮肤的存在;确定关键帧是否敏感;计算敏感帧分布密度,如果敏感帧分布密度超过阈值,则判为敏感视频。本发明能够有效防止用户从互联网观看敏感视频信息。一旦用户点击网页上的视频链接,该软件能自动下载视频,并且在播放过程中检测视频的敏感性。当播放到视频的敏感信息部分时,自动终止对视频的播放。本发明还能以直方图的方式表示出视频的每一关键帧的敏感程度。
-
公开(公告)号:CN114219936B
公开(公告)日:2025-03-28
申请号:CN202111266514.8
申请日:2021-10-28
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
IPC: G06V10/25 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明提供一种目标检测方法、电子设备、存储介质和计算机程序产品,方法包括获取包含待检测目标的待检测图像;将所述待检测图像输入至目标检测模型,进行目标检测,获得所述目标检测模型输出的目标检测结果,所述目标检测模型是基于候选框及其对应的正负标签训练得到的,所述正负标签是基于所述候选框与所述候选框对应的真实框的交并比,以及动态变化的交并比阈值确定得到的。本发明通过动态变化的交并比阈值,动态变化候选框的正负标签,以使最后分配给候选框的正负标签为准确标签,从而提高候选框的标签分配准确度,进而提高目标检测模型的召回率,最终实现高性能的目标检测。
-
公开(公告)号:CN119360893A
公开(公告)日:2025-01-24
申请号:CN202411523922.0
申请日:2024-10-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本公开关于声音分类方法、装置、电子设备、存储介质和计算机程序产品,包括:提取待分类的声音信号的音频特征;将音频特征输入脉冲残差模块,获得第一脉冲残差特征;将第一脉冲残差特征输入至少一个脉冲残差模块,获得第二脉冲残差特征;将第二脉冲残差特征以及经过下采样后的第一脉冲残差特征输入注意力特征融合模块,获得第一注意力融合特征;基于第一注意力融合特征,对待分类的声音信号进行分类。本公开可以充分利用脉冲神经网络(SNN)和残差神经网络的优势,可以实现高效、准确的进行声音分类,并可以显著降低系统功耗。
-
公开(公告)号:CN119314020A
公开(公告)日:2025-01-14
申请号:CN202411423624.4
申请日:2024-10-12
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及目标识别技术领域,公开了基于脉冲神经网络的视觉识别方法及装置,包括:对预设动态目标的视频样本数据进行脉冲编码得到脉冲序列,输入预设的脉冲神经网络进行残差计算,对脉冲网络输出特征进行长短期时序特征提取,将提取出的长短期时序特征与脉冲网络输出特征进行融合得到目标融合特征,计算目标融合特征的损失值,对脉冲神经网络进行反向迭代更新,得到目标长短期时序特征融合模型;将待识别的动态目标的视频流数据输入到长短期时序特征融合模型得到识别结果。本发明通过结合长短期时序特征提取,克服了现有脉冲神经网络在捕捉和识别动态数据时无法有效利用时序信息进行动态数据识别的缺陷,提升对于动态数据的视觉识别准确性。
-
公开(公告)号:CN118885942B
公开(公告)日:2024-12-06
申请号:CN202411357043.5
申请日:2024-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F18/2433 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06F18/23213 , G06F18/2413 , G06F18/27
Abstract: 本发明提供一种基于价格模式聚类学习的歧视定价识别方法以及装置,应用于人工智能领域,上述方法包括:获取包含歧视定价场景下的订单数据;针对类别数据、时间数据以及数值数据分别进行预处理,得到订单数据集;将非歧视定价子集输入至非歧视编码器,得到非歧视编码序列;将歧视定价子集输入至歧视编码器,得到歧视编码序列;将非歧视编码序列与歧视编码序列,分别输入至非歧视定价解码器与歧视定价解码器,得到非歧视预测价格与歧视预测价格;基于订单数据的真实价格分别与非歧视预测价格与歧视预测价格进行比较,得到用于表示真实价格为非歧视定价或歧视定价的定价识别结果。通过本发明能够实时对歧视定价行为进行准确识别。
-
-
-
-
-
-
-
-
-