-
公开(公告)号:CN118568487A
公开(公告)日:2024-08-30
申请号:CN202410548464.X
申请日:2024-05-06
Applicant: 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心天津分中心 , 中国科学院自动化研究所
IPC: G06F18/214 , G06F18/25 , G06F18/2431 , G06N3/042
Abstract: 本申请实施例提供一种多模态轻量级动态知识增强方法、装置及存储介质,所述方法包括:基于图像小样本集的向量表征和文本小样本集的向量表征,以多模态视觉码书的形式构建图像小样本知识库和文本小样本知识库;基于单模态搜索的方式从所述图像小样本知识库或所述文本小样本知识库中确定待融合表征的跨模态表征,融合所述待融合表征和所述跨模态表征,得到知识增强后的融合表征。本申请实施例提供的多模态轻量级动态知识增强方法、装置及存储介质,在现有大规模预训练多模态模型的强大表征学习基础上,融合罕见且细粒度的跨模态表征信息,以此提高原始表征的质量,并显著提升对特定信息的检索效率。
-
公开(公告)号:CN114666571B
公开(公告)日:2024-06-14
申请号:CN202210214422.3
申请日:2022-03-07
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
Abstract: 本发明提供一种视频敏感内容检测方法及系统,该方法包括:对待检测视频执行解码方法的部分步骤,提取所述待检测视频的压缩域信息;根据所述压缩域信息判断所述待检测视频的质量是否合格;在所述待检测视频的质量不合格的情况下,确定所述待检测视频中不存在敏感内容;在所述待检测视频的质量合格的情况下,根据所述压缩域信息对所述待检测视频进行敏感内容检测,确定所述待检测视频中是否存在敏感内容。本发明降低了敏感内容检测的资源消耗,提高检测效率和检测准确率。
-
公开(公告)号:CN116824710A
公开(公告)日:2023-09-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN115909479A
公开(公告)日:2023-04-04
申请号:CN202211289157.1
申请日:2022-10-20
Applicant: 中国科学院自动化研究所
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明提供一种人体行为识别方法、装置、电子设备及可读存储介质,其中人体行为识别方法包括:从压缩视频数据中提取压缩域信息,压缩域信息中包括多个I帧、残差以及运动矢量;将各I帧及各目标残差所对应的深层特征进行融合处理,得到各I帧对应的局部时空特征;将相邻两个局部时空特征进行融合处理,得到压缩视频数据对应的全局时空特征;基于全局时空特征、运动矢量及残差,确定压缩视频数据对应的目标特征,并基于目标特征确定压缩视频数据对应的人体行为识别结果。通过将各I帧及各目标残差进行融合,能得到表达能力更强的局部时空特征以及全局时空特征,基于全局时空特征、运动矢量及残差进行人体行为识别,能够提高人体行为识别的准确率。
-
公开(公告)号:CN112990273B
公开(公告)日:2021-12-21
申请号:CN202110190037.5
申请日:2021-02-18
Applicant: 中国科学院自动化研究所
IPC: G06K9/62 , G06K9/00 , G06N3/02 , G06N3/08 , G06F16/951
Abstract: 本发明属于图像识别领域,具体涉及了一种面向压缩域的视频敏感人物识别方法、系统、设备,旨在解决现有的敏感人物识别方法低效和浪费资源的问题。本发明包括:对待检测视频部分解码获取压缩域多模态信息,将压缩域多模态信息进行检测和校准,将校准后的压缩域人脸多模态信息通过训练好的多模态人脸识别网络获取多模态人脸特征,将多模态人脸特征与敏感人脸特征库进行比对,确认是否存在敏感人脸。其中,压缩域人脸多模态信息通过I分支、MV分支和Res分支分别提取不同的特征再进行多模态特征融合得到唯一的多模态人脸特征。本发明只需要进行部分解码就能完成特征提取,解决了现有技术低效和资源浪费的问题,同时保有较高的识别精度。
-
公开(公告)号:CN110222611B
公开(公告)日:2021-03-02
申请号:CN201910446596.0
申请日:2019-05-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉及深度学习领域,具体涉及了一种基于图卷积网络的人体骨架行为识别方法、系统、装置,旨在解决基于图卷积神经网络的人体骨架行为识别结果精度不高的问题。本发明方法包括:获取骨架视频帧并归一化;构建每一帧图对应的人体关节自然连接图;学习非自然连接边,获得人体关节连接图;为人体关节连接图各条边分配权重值;进行图卷积操作,获得骨架序列的空间信息;在时间维度上进行卷积操作,获得骨架序列的行为类别。本发明自然连接边能够学习到基本的人体行为特征,同时非自然连接边可以学习到附加的行为特征,通过自然连接边和非自然连接边共同构成一张图,可以更加充分的表征人体运动信息,提高识别性能。
-
公开(公告)号:CN112215908A
公开(公告)日:2021-01-12
申请号:CN202011086137.5
申请日:2020-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉领域,具体涉及一种面向压缩域的视频内容比对系统、优化方法、比对方法,旨在为了解决使用全解码信息完成视频内容比对效率不高的问题。本发明比对系统包括:特征学习模块,基于输入视频的多种压缩域信息,分别获取多种模态的特征图;多模态压缩域信息融合模块,对所述特征学习模块输出的多种模态的特征图进行信息融合,得到所述输入视频的融合特征向量;第二模块,配置为获取两个输入视频的融合特征向量的L1距离;分类器为二分类网络,配置为基于所述第二模块输出的L1距离进行比对结果的二分类。本发明可以有效地提取视频内容的高层语义信息,保证了视频内容的比对高速度和高性能。
-
公开(公告)号:CN110135562A
公开(公告)日:2019-08-16
申请号:CN201910360632.1
申请日:2019-04-30
Applicant: 中国科学院自动化研究所 , 国网通用航空有限公司
Abstract: 本发明属于计算机视觉及机器学习领域,具体涉及了一种基于特征空间变化的蒸馏学习方法、系统、装置,旨在解决学生网络无法学习教师网络全局知识的问题。本发明方法包括:按照蒸馏学习教师网络的参数结构构建对应的学生网络;分别选取预设的网络层,计算每一层的特征空间表示以及特定两个层间的跨层特征空间变化矩阵;计算基于特征空间变化的损失函数,根据真实标签计算分类损失函数;通过两个损失函数的加权将教师网络的特征空间变化作为知识迁移到学生网络中。本发明将教师网络层与层之间的特征空间变化刻画为一种新的知识,从而,使得学生网络在学习层与层之间的特征空间变化时,就学习到整个教师网络全局的知识。
-
公开(公告)号:CN119904715A
公开(公告)日:2025-04-29
申请号:CN202510125811.2
申请日:2025-01-27
Applicant: 中国科学院自动化研究所
IPC: G06V10/774 , G06V10/82 , G06V10/74 , G06N3/0464
Abstract: 本公开涉及一种基于跨模型泛化和扩散模型的数据集蒸馏方法和装置,所述方法包括:获取与目标数据集的应用场景对应的多种图像处理模型,得到模型池;从模型池中选择得到替代图像处理模型;将当前样本的特征和针对当前样本的提示词输入到扩散模型,得到替代样本;将替代样本输入到替代图像处理模型,得到替代图像处理模型的当前输出;其中,目标图像处理模型与替代图像处理模型同构;基于替代图像处理模型的当前输出和目标图像处理模型的当前输出,计算目标图像处理模型与替代图像处理模型之间的梯度匹配损失;基于梯度匹配损失对扩散模型进行训练;响应于训练完成,得到对目标数据集蒸馏后的替代数据集。
-
公开(公告)号:CN119206580A
公开(公告)日:2024-12-27
申请号:CN202411294779.2
申请日:2024-09-14
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/44 , G06V10/42 , G06N3/042 , G06V10/82 , G06V10/74 , G06N3/08 , G06V10/25 , G06N3/045
Abstract: 本发明提供一种基于时空域实例增强的视频复制片段定位方法及装置,其中方法包括:提取查询视频和参考视频中目标帧的区域特征和全局特征,并基于所述区域特征和所述全局特征构造实例关系图;基于所述实例关系图,分别通过空间分支和时间分支获取局部对齐信息和全局对齐信息;通过互补性感知对齐模块,基于所述局部对齐信息和所述全局对齐信息生成最终的帧间对齐结果;所述帧间对齐结果用于所述查询视频和所述参考视频的复制片段定位。其综合考虑了全局语义信息和细粒度的更加鲁棒的局部表示,提升查询视频和参考视频中视频帧的匹配精度,还可以提升查询视频和参考视频中复制片段匹配结果的准确性。
-
-
-
-
-
-
-
-
-