-
公开(公告)号:CN119479027A
公开(公告)日:2025-02-18
申请号:CN202411344797.7
申请日:2024-09-25
Applicant: 中国科学院自动化研究所
IPC: G06V40/16 , G06V40/40 , G06V10/764 , G06V10/80 , G06V10/86
Abstract: 本发明提供一种人脸活体检测方法及装置,其中方法包括:获取待识别人脸图像;将待识别人脸图像输入至训练后的人脸防伪模型,获取人脸防伪模型输出的人脸活体检测的判定结果;人脸防伪模型包括固有内容提示词提取模块、第一文本编辑器、图像编码器、可学习内容提示词提取模块、第二文本编辑器、跨模态引导模块和分类器。本发明提供的人脸活体检测方法及装置,通过结合固定模板和可学习提示生成实例级复合提示,并利用跨模态引导模块动态调整特征融合,以提高人脸防伪系统在未知领域的泛化能力,从而提高了人脸活体检测的准确性和可靠性。
-
公开(公告)号:CN114882337A
公开(公告)日:2022-08-09
申请号:CN202210560371.X
申请日:2022-05-23
Applicant: 之江实验室 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/40 , G06N3/04 , G06N3/08
Abstract: 本发明属于图像识别的动态类增量学习领域,公开了一种基于校正新旧任务类别混淆的类增量学习方法,包括了一个级联的知识蒸馏框架和一种特征回放的方法。级联的知识蒸馏框架首先校正旧模型的特征表示,生成一个校正后的教师网络,然后在学习新任务的同时将旧任务的知识从校正后的教师网络迁移到新模型。特征回放的方法主要是为缓解新旧任务类别数据的不平衡问题,通过保存旧任务类别更多的特征向量用于训练特征校正网络。本发明旨在校正新旧任务类别之间的混淆,缓解旧模型所代表的知识与新任务知识之间的冲突,以便在学习新任务的同时提升知识迁移的效率。
-
公开(公告)号:CN110069994B
公开(公告)日:2021-03-23
申请号:CN201910210915.8
申请日:2019-03-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于人脸识别领域,具体涉及一种基于人脸多区域的人脸属性识别系统、方法,旨在解决解决单张全局人脸图像的人脸属性识别忽略细节信息带来的识别率不高的问题,本发明系统包括预处理单元、人脸特征提取单元、预测单元;预处理单元对输入图像中人脸进行人脸关键点检测,进行人脸图像的对齐和裁剪,得到第一图像及其对应的人脸关键点;人脸特征提取单元提取全局人脸特征、局部人脸特征、融合人脸特征;预测单元将所述全局人脸特征、所述局部人脸特征、所述融合人脸特征进行拼接获取最终的分类特征,并基于特定的属性分类器进行属性识别。本发明可以基于人脸多区域提取更有效人脸属性特征,获得更精准的人脸属性估计。
-
公开(公告)号:CN110069994A
公开(公告)日:2019-07-30
申请号:CN201910210915.8
申请日:2019-03-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于人脸识别领域,具体涉及一种基于人脸多区域的人脸属性识别系统、方法,旨在解决解决单张全局人脸图像的人脸属性识别忽略细节信息带来的识别率不高的问题,本发明系统包括预处理单元、人脸特征提取单元、预测单元;预处理单元对输入图像中人脸进行人脸关键点检测,进行人脸图像的对齐和裁剪,得到第一图像及其对应的人脸关键点;人脸特征提取单元提取全局人脸特征、局部人脸特征、融合人脸特征;预测单元将所述全局人脸特征、所述局部人脸特征、所述融合人脸特征进行拼接获取最终的分类特征,并基于特定的属性分类器进行属性识别。本发明可以基于人脸多区域提取更有效人脸属性特征,获得更精准的人脸属性估计。
-
公开(公告)号:CN119339447B
公开(公告)日:2025-05-16
申请号:CN202411423929.5
申请日:2024-10-12
Applicant: 中国科学院自动化研究所
IPC: G06V40/40 , G06V40/16 , G06V20/00 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种跨模态融合引导CLIP的域泛化人脸防伪方法。所述方法包括将图像样本输入预处理单元进行预处理,包括人脸检测以及对检测到的人脸图像进行数据增强;基于细粒度提示模板单元为每个文本样本生成包括类别描述和内容描述的文本特征,基于域感知适配器单元为预处理后的图像样本生成视觉特征,将文本特征与视觉特征融合,形成跨模态的联合特征表示,并利用联合特征表示训练人脸防伪预测网络;将经过预处理单元处理的真实人脸图像输入训练好的人脸防伪预测网络,进行推理预测。本发明利用文本特征动态调整视觉特征,而非直接编辑视觉特征,从而增强模型对内容和类别语义的理解和关联,增强人脸防伪技术的域泛化能力。
-
公开(公告)号:CN118609202A
公开(公告)日:2024-09-06
申请号:CN202410630648.0
申请日:2024-05-21
Applicant: 中国科学院自动化研究所
IPC: G06V40/20 , G09B21/04 , G06V20/40 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/049 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 本发明提供一种手语翻译方法、装置、电子设备及存储介质,属于手语翻译技术领域,该方法包括:获取待翻译的手语视频;将所述手语视频输入至手语翻译模型,得到所述手语翻译模型输出的所述手语视频的翻译文本;所述手语翻译模型包括视觉编码器和大语言模型,所述视觉编码器用于提取所述手语视频的手语特征表示,所述大语言模型用于基于所述手语特征表示,输出所述手语视频的翻译文本;所述手语翻译模型是基于手语视频样本及对应的翻译文本标签进行训练得到的。本发明可以输出高质量的手语翻译文本,实现了无手语单词注释的手语翻译,同时也提高了手语翻译精度。
-
公开(公告)号:CN114722892A
公开(公告)日:2022-07-08
申请号:CN202210161710.7
申请日:2022-02-22
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提供一种基于机器学习的持续学习方法及装置,所述方法包括:确定执行至少两个训练任务;将各任务的训练集分别输入预存的机器学习模型,以获取各任务对应的生成模型和伪样本集;利用特征提取器分别提取对应任务的中心特征;将当前任务对应的伪样本集输入第一教师模型进行训练以获取第一生成样本;将上一个任务对应的伪样本集输入第二教师模型进行训练以获取第二生成样本;基于第一生成样本、第二生成样本和当前任务的中心特征训练学生模型以获取当前任务的目标学生模型;本发明所述方法采用样本生成重放与蒸馏学习相结合的训练方法提高了机器学习模型在复杂场景下的持续学习能力,缓解了模型的灾难性遗忘。
-
公开(公告)号:CN108197525B
公开(公告)日:2020-08-11
申请号:CN201711157541.5
申请日:2017-11-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于人脸识别技术领域,具体涉及一种人脸图像生成方法及装置。旨在解决如何对包含特定属性信息的人脸图像样本进行数据增广的技术问题。本发明提供一种人脸图像生成方法,包括将人脸样本图像和预设的人脸多属性条件向量输入对抗生成网络;分别对预设的噪声向量和预设的人脸多属性条件向量进行取样,将取样结果输入对抗生成网络的生成网络,得到合成图像;分别将合成图像与人脸样本图像输入对抗生成网络的判别网络,判别网络无法区分合成图像和输入的图像时,将合成图像作为符合人脸多属性条件的人脸图像输出。本发明能够在训练集样本难以获取的情况下,对原有的生成对抗网络进行拓展,通过多属性条件的引导,生成指定属性条件的图像。
-
公开(公告)号:CN106503623B
公开(公告)日:2019-10-08
申请号:CN201610857697.3
申请日:2016-09-27
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公开了图像识别领域中基于卷积神经网络(CNN)的人脸图像年龄估算方法。在传统的年龄识别技术中,一个训练样本只对应一个年龄标签,忽略了相邻年龄之间的关系。本发明基于卷积神经网络,每个样本对应多个年龄标签,使得训练得到的年龄估算模型更加精准。本发明包含以下步骤:首先是对输入图像进行人脸检测、人脸关键点检测、人脸对齐、图像裁剪等;然后是对年龄老化过程进行建模,计算各个表观年龄的概率,储存成年龄分布表;接下来是利用已对齐的人脸图像结合年龄分布表以及目标函数来训练CNN网络;最后,就可以利用训练好的CNN网络,对输入的人脸图像进行年龄估算。
-
公开(公告)号:CN106529402B
公开(公告)日:2019-05-28
申请号:CN201610856231.1
申请日:2016-09-27
Applicant: 中国科学院自动化研究所
IPC: G06K9/00
Abstract: 本发明公布了一种基于多任务学习的卷积神经网络(CNN)的人脸属性分析方法。该方法主要是以卷积神经网络为基础,采用多任务学习的方法对人脸图像同时进行年龄估算、性别识别和种族分类。在传统的处理方法中,人脸多属性分析时,需要分多次计算,既消耗时间,又降低了模型的泛化能力。本发明通过对三个单任务网络分别进行训练,然后选用收敛最慢网络的权值初始化多任务网络的共享部分,随机初始化多任务网络的独立部分;接下来对多任务网络进行训练,得到多任务CNN网络模型;最后,就可以利用训练好的多任务CNN网络模型对输入的人脸图像同时进行年龄、性别和种族三个属性的分析,既节约了时间又获得了较高的准确度。
-
-
-
-
-
-
-
-
-