-
公开(公告)号:CN116824710B
公开(公告)日:2025-04-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN116778376A
公开(公告)日:2023-09-19
申请号:CN202310530291.4
申请日:2023-05-11
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/774 , G06V10/42 , G06V10/80
Abstract: 本发明提供一种内容安全检测模型训练方法、检测方法和装置,其中训练方法包括:获取第一样本视频,并提取第一样本视频的压缩域信息;提取第一样本视频中的各帧图像在标准色域下的多源特征;基于第一样本视频的压缩域信息和标准色域下的多源特征,对初始模型进行跨模态蒸馏学习,得到训练完成的内容安全检测模型。本发明提供的内容安全检测模型训练方法、检测方法和装置,相比于现有的逐帧提取标准色域信息,极大提高了信息提取效率,并利用标准色域下的多源特征,对初始模型进行跨模态蒸馏学习,从而提升了压缩域内容安全检测的性能,能够同时兼顾效率和性能。
-
公开(公告)号:CN115690645A
公开(公告)日:2023-02-03
申请号:CN202211120031.1
申请日:2022-09-14
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06V10/50 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895 , G10L25/51 , G10L25/30 , G10L25/03
Abstract: 本发明提供一种视频检测方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理视频;对待处理视频的图像进行视觉特征提取,得到视觉特征信息;对待处理视频的语音进行音频特征提取,得到音频特征信息;基于视觉特征信息和音频特征信息,确定待处理视频是否为安全视频。本发明提供的视频检测方法、装置、设备、存储介质及程序产品用于提高对待处理视频进行安全检测的准确性。
-
公开(公告)号:CN115019087A
公开(公告)日:2022-09-06
申请号:CN202210557333.9
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/77
Abstract: 本发明提供一种小样本视频分类和分类模型训练方法及其装置,涉及计算机视觉技术领域,所述分类方法包括:将小样本分类任务输入预先构建的收敛的压缩域长短时Cross‑Transformer模型,获取压缩域信息;基于压缩域信息,获取短时融合的帧特征;基于短时融合的帧特征,获取查询特征,并输出基于查询特征获取的小样本分类任务中查询视频对各个查询类别原型所属支撑类别的分类分数,其中,分类分数最大的支撑类别用于表示查询视频的分类结果。本发明可实现少量示例视频下的快速、高精度、高效率的小样本视频分类。
-
公开(公告)号:CN116778376B
公开(公告)日:2024-03-22
申请号:CN202310530291.4
申请日:2023-05-11
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/764 , G06V10/774 , G06V10/42 , G06V10/80
Abstract: 本发明提供一种内容安全检测模型训练方法、检测方法和装置,其中训练方法包括:获取第一样本视频,并提取第一样本视频的压缩域信息;提取第一样本视频中的各帧图像在标准色域下的多源特征;基于第一样本视频的压缩域信息和标准色域下的多源特征,对初始模型进行跨模态蒸馏学习,得到训练完成的内容安全检测模型。本发明提供的内容安全检测模型训练方法、检测方法和装置,相比于现有的逐帧提取标准色域信息,极大提高了信息提取效率,并利用标准色域下的多源特征,对初始模型进行跨模态蒸馏学习,从而提升了压缩域内容安全检测的性能,能够同时兼顾效率和性能。
-
公开(公告)号:CN111612143B
公开(公告)日:2023-12-19
申请号:CN202010440475.8
申请日:2020-05-22
Applicant: 中国科学院自动化研究所
IPC: G06N3/082 , G06N3/084 , G06N3/0495 , G06N3/0464
Abstract: 本发明涉及一种深度卷积神经网络的压缩方法及系统,所述压缩方法包括:根据滤波器重要性选择方式和/或模型压缩率,确定待压缩深度卷积神经网络中不重要的滤波器;对不重要的滤波器施加渐进式稀疏约束,作为正则项加入到网络训练的损失函数中,得到优化损失函数;根据正则项,采用阈值迭代算法及反向传播算法联合求解,得到待压缩深度卷积神经网络的更新参数;基于所述优化损失函数及更新参数,获得具有滤波器稀疏形式的卷积神经网络模型;利用结构化剪枝算法,对所述具有滤波器稀疏形式的卷积神经网络模型进行剪枝,得到网络精度较高的压缩后的卷积神经网络模型。
-
公开(公告)号:CN112215908B
公开(公告)日:2022-12-02
申请号:CN202011086137.5
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种面向压缩域的视频内容比对系统、优化方法、比对方法,旨在为了解决使用全解码信息完成视频内容比对效率不高的问题。本发明比对系统包括:特征学习模块,基于输入视频的多种压缩域信息,分别获取多种模态的特征图;多模态压缩域信息融合模块,对所述特征学习模块输出的多种模态的特征图进行信息融合,得到所述输入视频的融合特征向量;第二模块,配置为获取两个输入视频的融合特征向量的L1距离;分类器为二分类网络,配置为基于所述第二模块输出的L1距离进行比对结果的二分类。本发明可以有效地提取视频内容的高层语义信息,保证了视频内容的比对高速度和高性能。
-
公开(公告)号:CN118296446A
公开(公告)日:2024-07-05
申请号:CN202410728250.0
申请日:2024-06-06
Applicant: 中国科学院自动化研究所
IPC: G06F18/24 , G06F18/22 , G06V10/762
Abstract: 本发明提供一种音视频内容风险识别方法、装置、电子设备和存储介质,属于多媒体内容安全识别领域,该方法包括:构建多模态特征推理模型;构建风险样例知识库,所述风险样例知识库中包含至少一个风险样例分别对应的多模态特征向量,所述至少一个风险样例分别属于至少一种风险类别;将待识别音视频输入所述多模态特征推理模型,获得所述待识别音视频的多模态特征向量;将所述待识别音视频的多模态特征向量与所述风险样例知识库中的多模态特征向量进行相似度计算,并基于相似度输出所述待识别音视频的风险类别,可以提高风险内容识别的精准率和召回率。
-
公开(公告)号:CN112235569B
公开(公告)日:2024-03-29
申请号:CN202011086957.4
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: H04N19/107 , H04N19/109 , H04N19/11 , H04N19/124 , H04N19/139 , H04N19/91 , G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08 , G06T7/207 , G06T7/246
Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于H264压缩域的快速视频分类方法、系统及装置,旨在解决现有视频分类技术速度慢、模型复杂度高的问题。本发明包括:提取H264标准的视频的I帧、P帧和B帧数据;进行I帧的解码及P帧和B帧的熵解码,获得I帧图像及视频帧之间的运动矢量;分别构建高低时间分辨率模型,并通过时间尺度注意力模块建模不同时间分辨率的特征进行模型融合;基于I帧图像和帧之间的运动矢量,获取四个初步预测分类;进行四个初步预测分类的加权融合,获得最终的预测分类结果。本发明无需进行所有视频帧的全解码,模型参数量小,可以有效提高视频分类速度,并能很好地识别视频中快慢不同的运动信息,实用性更强。
-
公开(公告)号:CN115311475A
公开(公告)日:2022-11-08
申请号:CN202210752086.8
申请日:2022-06-28
Applicant: 中国科学院自动化研究所 , 中国国家铁路集团有限公司
Abstract: 本发明提供一种基于内容安全的图像识别方法、装置、设备和存储介质,涉及计算机视觉技术领域,所述方法包括:获取待识别图像;将待识别图像输入至多尺度纹理感知模型,输出用于表征图像是否伪造的图像种类识别结果;其中,多尺度纹理感知模型是基于图像样本数据以及对应的图像种类标签进行训练后得到的,多尺度纹理感知模型用于基于待识别图像的多尺度纹理特征任意两通道之间的相关性,对待识别图像进行种类识别。本发明可结合多尺度纹理特征以及各特征不同通道之间的细微差异,以提高图像种类识别精准度,且提高鲁棒性和泛化性。
-
-
-
-
-
-
-
-
-