-
公开(公告)号:CN112235569B
公开(公告)日:2024-03-29
申请号:CN202011086957.4
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: H04N19/107 , H04N19/109 , H04N19/11 , H04N19/124 , H04N19/139 , H04N19/91 , G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08 , G06T7/207 , G06T7/246
Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于H264压缩域的快速视频分类方法、系统及装置,旨在解决现有视频分类技术速度慢、模型复杂度高的问题。本发明包括:提取H264标准的视频的I帧、P帧和B帧数据;进行I帧的解码及P帧和B帧的熵解码,获得I帧图像及视频帧之间的运动矢量;分别构建高低时间分辨率模型,并通过时间尺度注意力模块建模不同时间分辨率的特征进行模型融合;基于I帧图像和帧之间的运动矢量,获取四个初步预测分类;进行四个初步预测分类的加权融合,获得最终的预测分类结果。本发明无需进行所有视频帧的全解码,模型参数量小,可以有效提高视频分类速度,并能很好地识别视频中快慢不同的运动信息,实用性更强。
-
公开(公告)号:CN111598167B
公开(公告)日:2023-04-07
申请号:CN202010418929.1
申请日:2020-05-18
Applicant: 中国科学院自动化研究所
IPC: G06F18/21 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及一种基于图学习的小样本图像识别方法及系统,所述图像识别方法包括:获取源域样本图像数据集;以各样本图像作为节点,建立无向带权图;基于特征生成模型提取各样本图像的基础特征向量;对各节点之间执行信息的传递和聚合,得到优化特征向量;基于优化特征向量,建立图像识别模型;根据所述优化特征向量,建立对比损失函数;采用随机梯度下降方法优化图像识别模型的参数直到对比损失函数收敛,以确定面向小样本图像的识别模型;根据面向小样本图像的识别模型,确定待测样本图像的所属类别。通过学习出来的识别模型在小样本场景下可以放大异类样本的类间差异,缩小同类样本的类内差异,极大提升了小样本识别的准确率。
-
公开(公告)号:CN115311595A
公开(公告)日:2022-11-08
申请号:CN202210771422.3
申请日:2022-06-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种视频特征提取方法、装置及电子设备,涉及视频处理技术领域,可以应用于视频特征提取的场景。该视频特征提取方法包括:获取视频图像和视频图像对应的音频数据;将音频数据转换为声谱图,得到声谱图像;将视频图像和声谱图像输入至视频特征提取模型,得到视频特征提取模型输出的视频特征;其中,视频特征提取模型是基于样本视频数据和对偶式对比学习模型对基础神经网络模型进行预训练得到的,对偶式对比学习模型用于对样本视频数据经基础神经网络模型处理后输出的第一多模态样本特征矩阵分别进行行维度和列维度上的对比学习。本发明提供的技术方案可以提高视频特征提取的准确性和泛化性。
-
公开(公告)号:CN115311475A
公开(公告)日:2022-11-08
申请号:CN202210752086.8
申请日:2022-06-28
Applicant: 中国科学院自动化研究所 , 中国国家铁路集团有限公司
Abstract: 本发明提供一种基于内容安全的图像识别方法、装置、设备和存储介质,涉及计算机视觉技术领域,所述方法包括:获取待识别图像;将待识别图像输入至多尺度纹理感知模型,输出用于表征图像是否伪造的图像种类识别结果;其中,多尺度纹理感知模型是基于图像样本数据以及对应的图像种类标签进行训练后得到的,多尺度纹理感知模型用于基于待识别图像的多尺度纹理特征任意两通道之间的相关性,对待识别图像进行种类识别。本发明可结合多尺度纹理特征以及各特征不同通道之间的细微差异,以提高图像种类识别精准度,且提高鲁棒性和泛化性。
-
公开(公告)号:CN114241144A
公开(公告)日:2022-03-25
申请号:CN202111467249.X
申请日:2021-12-03
Applicant: 中国科学院自动化研究所
Abstract: 本申请公开了一种处理三维点云的方法、装置及存储介质。其中,方法包括:至少两个处理模块中的任一处理模块,接收三维点数据集,三维点数据集来自于处理模块之前所有层级的处理模块,分别获取三维点数据集中至少两个空间区域的区域特征数据,聚集至少两个空间区域的区域特征数据得到三维点数据集的特征数据,从而降低了三维点云的计算过程较复杂度,提高了计算速度,若处理模块是处理模型中中间层的处理模块,将三维点数据集的特征数据分别输出至到处理模块之后每一层的处理模块中,若处理模块是处理模型中最后一层处理模块,将三维点数据集的特征数据作为三维点云对应的几何表征,从而不会出现几何信息缺失,提升了三维点云得到的数据准确率。
-
公开(公告)号:CN114219936A
公开(公告)日:2022-03-22
申请号:CN202111266514.8
申请日:2021-10-28
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
IPC: G06V10/25 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种目标检测方法、电子设备、存储介质和计算机程序产品,方法包括获取包含待检测目标的待检测图像;将所述待检测图像输入至目标检测模型,进行目标检测,获得所述目标检测模型输出的目标检测结果,所述目标检测模型是基于候选框及其对应的正负标签训练得到的,所述正负标签是基于所述候选框与所述候选框对应的真实框的交并比,以及动态变化的交并比阈值确定得到的。本发明通过动态变化的交并比阈值,动态变化候选框的正负标签,以使最后分配给候选框的正负标签为准确标签,从而提高候选框的标签分配准确度,进而提高目标检测模型的召回率,最终实现高性能的目标检测。
-
公开(公告)号:CN112991476B
公开(公告)日:2021-09-28
申请号:CN202110190015.9
申请日:2021-02-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像识别领域,具体涉及了一种基于深度压缩域特征的场景分类方法、系统、装置,旨在解决现有的场景分类方法由于图像的分辨率高数据庞大而导致的计算资源浪费、实时性差以及存储空间占用过多的问题。本发明包括:通过JPEG压缩方法对待测图像进行部分解码,获得待测图像的三通道DCT系数,通过反卷积调节所述三通道DCT系数的尺寸,获得尺寸匹配的三通道DCT系数,将所述尺寸匹配的三通道DCT系数进行拼接融合,获取深度压缩域特征,基于所述深度压缩域特征,通过训练好的压缩域特征分类网络,获取所述待测图像的场景类别。本发明避免了将图像全部解码造成额外计算成本增加和存储介质浪费,降低了时间消耗和计算资源消耗。
-
公开(公告)号:CN112991476A
公开(公告)日:2021-06-18
申请号:CN202110190015.9
申请日:2021-02-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于图像识别领域,具体涉及了一种基于深度压缩域特征的场景分类方法、系统、装置,旨在解决现有的场景分类方法由于图像的分辨率高数据庞大而导致的计算资源浪费、实时性差以及存储空间占用过多的问题。本发明包括:通过JPEG压缩方法对待测图像进行部分解码,获得待测图像的三通道DCT系数,通过反卷积调节所述三通道DCT系数的尺寸,获得尺寸匹配的三通道DCT系数,将所述尺寸匹配的三通道DCT系数进行拼接融合,获取深度压缩域特征,基于所述深度压缩域特征,通过训练好的压缩域特征分类网络,获取所述待测图像的场景类别。本发明避免了将图像全部解码造成额外计算成本增加和存储介质浪费,降低了时间消耗和计算资源消耗。
-
公开(公告)号:CN112990273A
公开(公告)日:2021-06-18
申请号:CN202110190037.5
申请日:2021-02-18
Applicant: 中国科学院自动化研究所
IPC: G06K9/62 , G06K9/00 , G06N3/02 , G06N3/08 , G06F16/951
Abstract: 本发明属于图像识别领域,具体涉及了一种面向压缩域的视频敏感人物识别方法、系统、设备,旨在解决现有的敏感人物识别方法低效和浪费资源的问题。本发明包括:对待检测视频部分解码获取压缩域多模态信息,将压缩域多模态信息进行检测和校准,将校准后的压缩域人脸多模态信息通过训练好的多模态人脸识别网络获取多模态人脸特征,将多模态人脸特征与敏感人脸特征库进行比对,确认是否存在敏感人脸。其中,压缩域人脸多模态信息通过I分支、MV分支和Res分支分别提取不同的特征再进行多模态特征融合得到唯一的多模态人脸特征。本发明只需要进行部分解码就能完成特征提取,解决了现有技术低效和资源浪费的问题,同时保有较高的识别精度。
-
公开(公告)号:CN112950576A
公开(公告)日:2021-06-11
申请号:CN202110220740.6
申请日:2021-02-26
Applicant: 中国科学院自动化研究所 , 人民中科(济南)智能技术有限公司
Abstract: 本发明涉及一种基于深度学习的输电线路缺陷智能识别方法及系统,所述智能识别方法包括:获取待测输电线路图像;根据所述输电线路图像,基于多分辨率融合金字塔,确定粗粒度多分辨率层特征信息;根据所述粗粒度多分辨率层特征信息,基于细粒度交互金字塔,得到细粒度多分辨率层特征信息;根据所述细粒度多分辨率层特征信息,基于特征增强金字塔,得到增强特征图像;根据增强特征图像,确定待测输电线路的缺陷类别及缺陷位置,可提高对多尺度目标的检测精度。
-
-
-
-
-
-
-
-
-