-
公开(公告)号:CN112235569A
公开(公告)日:2021-01-15
申请号:CN202011086957.4
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: H04N19/107 , H04N19/109 , H04N19/11 , H04N19/124 , H04N19/139 , H04N19/91 , G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08 , G06T7/207 , G06T7/246
Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于H264压缩域的快速视频分类方法、系统及装置,旨在解决现有视频分类技术速度慢、模型复杂度高的问题。本发明包括:提取H264标准的视频的I帧、P帧和B帧数据;进行I帧的解码及P帧和B帧的熵解码,获得I帧图像及视频帧之间的运动矢量;分别构建高低时间分辨率模型,并通过时间尺度注意力模块建模不同时间分辨率的特征进行模型融合;基于I帧图像和帧之间的运动矢量,获取四个初步预测分类;进行四个初步预测分类的加权融合,获得最终的预测分类结果。本发明无需进行所有视频帧的全解码,模型参数量小,可以有效提高视频分类速度,并能很好地识别视频中快慢不同的运动信息,实用性更强。
-
公开(公告)号:CN115690645A
公开(公告)日:2023-02-03
申请号:CN202211120031.1
申请日:2022-09-14
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06V10/50 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895 , G10L25/51 , G10L25/30 , G10L25/03
Abstract: 本发明提供一种视频检测方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理视频;对待处理视频的图像进行视觉特征提取,得到视觉特征信息;对待处理视频的语音进行音频特征提取,得到音频特征信息;基于视觉特征信息和音频特征信息,确定待处理视频是否为安全视频。本发明提供的视频检测方法、装置、设备、存储介质及程序产品用于提高对待处理视频进行安全检测的准确性。
-
公开(公告)号:CN115019087A
公开(公告)日:2022-09-06
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN109190750B
公开(公告)日:2021-06-08
申请号:CN201810737975.0
申请日:2018-07-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明涉及深度学习技术领域,具体提供了一种基于对抗生成网络的小样本生成方法及装置,旨在解决如何在少量样本数据的情况下利用生成对抗网络生成样本数据的技术问题。为此目的,本发明提供的基于对抗生成网络的小样本生成方法能够基于对抗生成网络并根据随机噪声和标签信息,生成小样本类型对应的样本。在此过程中,本发明采用迁移学习和批量训练的方法对对抗生成网络进行网络训练,使生成对抗网络可以有效迁移应用于少量样本的对抗生成网络样本生成任务中。
-
公开(公告)号:CN110674673A
公开(公告)日:2020-01-10
申请号:CN201910697979.5
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种视频关键帧抽取方法、装置和存储介质,用以减少视频处理过程中的冗余信息,提高视频处理速度。所述视频关键帧抽取方法,包括:从待分析视频中提取I帧;针对提取的每一I帧,利用深度哈希网络确定其对应的深度哈希码,所述深度哈希网络为利用预先生成的图像样本对进行训练得到的;根据各I帧对应的深度哈希码,分别确定两两I帧深度哈希码之间的汉明距离;根据两两I帧深度哈希码之间的汉明距离,对提取的I帧进行聚类;针对每一聚类,分别确定该聚类中包含的每一I帧的信息熵;从每一聚类中,提取信息熵最大的I帧组成所述待分析视频的关键帧。
-
公开(公告)号:CN119991739A
公开(公告)日:2025-05-13
申请号:CN202510464889.7
申请日:2025-04-14
Applicant: 中国科学院自动化研究所
IPC: G06T7/246 , G06V10/82 , G06V10/40 , G06N3/0464
Abstract: 本公开提供了一种跨视角多目标跟踪方法、装置、电子设备和存储介质,该方法包括:在跟踪过程中的每个时刻,执行以下步骤:对不同视角的视频的当前帧分别进行目标检测处理,得到每个视角的每个目标的目标信息;使用单视角特征提取网络,从目标信息中提取单视角特征;使用跨视角特征提取网络,从目标信息中提取跨视角特征;构建无向图,其中,无向图中的节点包括当前时刻检测到的每个视角的每个目标的目标节点,以及当前已确定的每个目标轨迹的轨迹节点;根据每个节点的属性,将无向图中对应于同一目标的节点分割至同一子图;基于每个子图中的各个节点的属性,确定子图对应的目标轨迹以及目标轨迹的属性。
-
公开(公告)号:CN119904715A
公开(公告)日:2025-04-29
申请号:CN202510125811.2
申请日:2025-01-27
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/82 , G06V10/74 , G06N3/0464
Abstract: 本公开涉及一种基于跨模型泛化和扩散模型的数据集蒸馏方法和装置,所述方法包括:获取与目标数据集的应用场景对应的多种图像处理模型,得到模型池;从模型池中选择得到替代图像处理模型;将当前样本的特征和针对当前样本的提示词输入到扩散模型,得到替代样本;将替代样本输入到替代图像处理模型,得到替代图像处理模型的当前输出;其中,目标图像处理模型与替代图像处理模型同构;基于替代图像处理模型的当前输出和目标图像处理模型的当前输出,计算目标图像处理模型与替代图像处理模型之间的梯度匹配损失;基于梯度匹配损失对扩散模型进行训练;响应于训练完成,得到对目标数据集蒸馏后的替代数据集。
-
公开(公告)号:CN119399029A
公开(公告)日:2025-02-07
申请号:CN202510013541.6
申请日:2025-01-06
Applicant: 中国科学院自动化研究所
IPC: G06T3/4053 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于解耦对比学习的隐式图像退化估计方法,属于图像盲超分辨率技术领域,所述方法采样具有相同退化信息的不同LR图像中的图块来构建正样本集合,在数据层面保障了内容、纹理等任务无关信息不会影响退化特征学习,同时,通过不断地循环配对采样图块来实现数据扩增;在训练过程中引入特征增强策略增加相同退化类型的正样本数量,从而在训练过程中进一步扩展每个退化类别的样本多样性,以保障网络更充分的学习退化信息。将利用本发明训练的隐式图像退化估计器应用于基于隐式退化特征引导的盲图像超分辨率网络,可以有效提升LR图像的退化信息建模质量,进而改善LR图像到HR图像的重建效果。
-
公开(公告)号:CN119342233A
公开(公告)日:2025-01-21
申请号:CN202411299969.3
申请日:2024-09-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于时空令牌合并的视频处理方法、装置、电子设备及存储介质,属于视频处理技术领域,包括:获取第一组令牌和第二组令牌,其中,第一组令牌和第二组令牌为一组视频帧中相邻的两个视频帧对应的两组令牌;将第一组令牌和第二组令牌输入第一变换器块,得到第一变换器块输出的部分第一组令牌、部分第二组令牌和一组时序合并令牌;将部分第一组令牌、部分第二组令牌和一组时序合并令牌进行拼接,得到第三组令牌;将第三组令牌输入第二变换器块,得到第二变换器块输出的第四组令牌。本发明提供的基于时空令牌合并的视频处理方法,解决了相关技术中的基于时空令牌合并的视频处理方法,存在视频信息容易丢失且处理性能有限的技术问题。
-
公开(公告)号:CN119314081A
公开(公告)日:2025-01-14
申请号:CN202411355315.8
申请日:2024-09-26
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/049
Abstract: 本公开提供了一种视频分类方法、装置、电子设备、存储介质和程序产品,视频分类方法包括:获取目标视频帧序列;对目标视频帧序列进行树状取样,得到两层结构的视频帧序列和关键帧;基于卷积神经网络模型对视频帧序列进行特征提取处理,得到时序特征;基于脉冲神经网络模型对关键帧进行特征提取处理,得到脉冲特征;对时序特征和脉冲特征进行融合处理,得到视频融合特征;根据视频融合特征进行分类处理,得到目标视频帧序列的类别信息。该方法能够提升视频的特征表达力,从而提升了视频分类的准确性,能够更好地完成视频分类任务。
-
-
-
-
-
-
-
-
-