基于多任务深度学习的人脸属性识别方法

    公开(公告)号:CN106203395A

    公开(公告)日:2016-12-07

    申请号:CN201610591877.1

    申请日:2016-07-26

    Applicant: 厦门大学

    Abstract: 基于多任务深度学习的人脸属性识别方法,涉及计算机视觉中的人脸属性识别。准备图像数据集;对图像数据集中的每幅图像逐一进行人脸检测;对所有检测到的人脸进行人脸关键点检测;对检测到的人脸关键点将每幅人脸根据人脸对齐方法,对齐到标准的人脸图像上,构成人脸图像训练集;计算出训练集中的平均人脸图像;构建多任务深度卷积神经网络,把人脸图像训练集中的每幅人脸图像减去平均人脸图像后进行网络参数的训练,得卷积神经网络模型;将待识别的测试图像进行人脸检测和人脸关键点检测,并根据人脸关键点将图像中的人脸对齐到标准的人脸图像上;将标准的人脸图像减去平均人脸图像,并放到构建好的卷积神经网络模型中进行前馈运算操作,即得。

    基于歧义指导互标签更新的鲁棒知识蒸馏方法

    公开(公告)号:CN114330580B

    公开(公告)日:2025-05-06

    申请号:CN202111676330.9

    申请日:2021-12-31

    Abstract: 本发明公开了基于歧义指导互标签更新的鲁棒知识蒸馏方法,包括:A、构建训练数据集;B、构建教师网络和学生网络;C、通过鲁棒学习方法对教师网络进行训练;D、对数据集中的每个样本进行歧义感知权重估计和权重分配;E、根据小损失标准对数据集中的样本进行标签重新标注,结合教师网络特征的标签传播算法更新标签,再计算损失和更新网络参数;F、在学生网络和教师网络之间进行互标签传播算法,并更新样本标签、计算损失和更新网络参数;G、将测试图像数据导入学生网络,由其得到预测结果且用于图像分类;本方案可以有效地提升知识蒸馏对噪声标签的鲁棒性,从而可以在噪声标签的环境下获取一个高性能的轻量级网络,其更能适用于实际情况。

    联邦学习场景下的人脸表情识别方法

    公开(公告)号:CN119091482A

    公开(公告)日:2024-12-06

    申请号:CN202411051228.3

    申请日:2024-08-01

    Applicant: 厦门大学

    Inventor: 严严 丁虎 王菡子

    Abstract: 本发明公开了联邦学习场景下的人脸表情识别方法,本方案巧妙性通过将全局局部干扰解耦(GLDD)方法用于联邦表情识别,使得模型训练过程中,其局部干扰解耦可以通过自适应考虑干扰对本地客户端的影响,缓解了异构干扰的挑战;同时,全局干扰解耦通过聚合来自全局服务器上的客户端的表情和干扰信息,降低了异构表情数据和异构干扰的影响。

    基于统一中间模态的跨模态行人重识别方法

    公开(公告)号:CN113903053B

    公开(公告)日:2024-06-07

    申请号:CN202111129224.9

    申请日:2021-09-26

    Applicant: 厦门大学

    Abstract: 基于统一中间模态的跨模态行人重识别方法,涉及计算机视觉技术领域。包括以下步骤:1)将两种模态图像分别输入到两个编码器中进行编码;2)将编码得到的两种特征输入到两个非线性激活函数中用于加深其非线性表达能力;3)将非线性激活后的两种特征输入到一个共享的解码器中,并解码到一个统一的中间图像空间中,得到中间模态图像;4)将得到的中间模态图像与原始图像一起输入到网络中进行优化,完成跨模态行人重识别。可降低模态差异,进一步地拉近两种中间模态图像之间的距离,提升跨模态行人重识别模型的性能。

    基于双模式网络的多数据集X光安检图像目标检测方法

    公开(公告)号:CN116071704A

    公开(公告)日:2023-05-05

    申请号:CN202310110761.1

    申请日:2023-02-13

    Applicant: 厦门大学

    Abstract: 本发明涉及一种基于双模式网络的多数据集X光安检图像目标检测方法,包括:将Lattice外观增强子网络连接基础特征提取网络形成目标检测网络;通过目标检测网络和K个X光安检图像数据集训练K个目标检测网络的教师模型;构建K个X光安检图像数据集的共同类模式学习网络和独特类模式学习网络;使用训练后的K个目标检测网络的教师模型轮流对目标检测网络的学生模型在共同类模式学习网络和独特类模式学习网络下进行知识蒸馏;利用反向传播算法训练知识蒸馏后的目标检测网络的学生模型;使用训练后的目标检测网络的学生模型对X光安检图像进行目标检测,得到X光安检图像中违禁品的位置及对应类别。可以精准检测违禁品的位置及对应类别,并标记出违禁品。

    一种基于丢弃损失函数的人物属性识别方法

    公开(公告)号:CN112200260B

    公开(公告)日:2022-06-14

    申请号:CN202011116242.9

    申请日:2020-10-19

    Applicant: 厦门大学

    Abstract: 一种基于丢弃损失函数的人物属性识别方法,涉及基于内容的图像识别。首先设计基于ResNet‑50的深度卷积神经网络,然后设计丢弃损失函数中包含的离群样本丢弃策略,计算梯度值,选择性丢弃梯度值大于一定阈值的样本权重,再设计丢弃损失函数中包含的样本加权丢弃策略,选择性丢弃其梯度值最小的一部分样本,通过对样本加权的方式来平衡其正负类别的样本的分布,最后将训练样本集中的图像放进基于ResNet‑50的深度卷积神经网络计算得到总体损失,并利用反向传播算法进行端到端的训练,利用训练好的模型进行多属性识别,神经网络输出的特征即为识别结果。性能卓越,可有效识别图片中的多个属性,在平衡精度标准上有明显优势。

    一种基于深度多分支聚合的实时街景图像语义分割方法

    公开(公告)号:CN113011336B

    公开(公告)日:2022-05-27

    申请号:CN202110297170.0

    申请日:2021-03-19

    Applicant: 厦门大学

    Inventor: 严严 翁熙 王菡子

    Abstract: 一种基于深度多分支聚合的实时街景图像语义分割方法,涉及计算机视觉技术。采用流行的编码器‑解码器结构;首先采用轻量级的图像分类网络作为基础,将其改造作为编码器;然后将编码器分为不同的子网络,并将各子网络中的特征分别送入设计的多分支特征聚合网络中和全局上下文模块;接着在多分支特征聚合网络中利用格型增强残差模块和特征变换模块对需要聚合的特征进行空间细节和语义信息上的增强;最后按照特征图的大小,从小到大逐级聚合全局上下文模块的输出特征图和多分支特征聚合网络的输出特征图,以得到最终的语义分割结果图。在处理较大分辨率的街景图像的同时,保持较高的街景图像语义分割精度和实时的预测速度。

    基于歧义指导互标签更新的鲁棒知识蒸馏方法

    公开(公告)号:CN114330580A

    公开(公告)日:2022-04-12

    申请号:CN202111676330.9

    申请日:2021-12-31

    Abstract: 本发明公开了基于歧义指导互标签更新的鲁棒知识蒸馏方法,包括:A、构建训练数据集;B、构建教师网络和学生网络;C、通过鲁棒学习方法对教师网络进行训练;D、对数据集中的每个样本进行歧义感知权重估计和权重分配;E、根据小损失标准对数据集中的样本进行标签重新标注,结合教师网络特征的标签传播算法更新标签,再计算损失和更新网络参数;F、在学生网络和教师网络之间进行互标签传播算法,并更新样本标签、计算损失和更新网络参数;G、将测试图像数据导入学生网络,由其得到预测结果且用于图像分类;本方案可以有效地提升知识蒸馏对噪声标签的鲁棒性,从而可以在噪声标签的环境下获取一个高性能的轻量级网络,其更能适用于实际情况。

    一种基于生成式对抗网络的人脸表情识别方法

    公开(公告)号:CN109508669B

    公开(公告)日:2021-07-23

    申请号:CN201811332661.9

    申请日:2018-11-09

    Applicant: 厦门大学

    Inventor: 严严 黄颖 王菡子

    Abstract: 一种基于生成式对抗网络的人脸表情识别方法,涉及计算机视觉技术。首先设计一个基于生成式对抗网络的人脸表情生成网络并对其预训练,该网络由一个生成器和两个判别器构成,能够生成指定表情的随机身份的人脸图;然后设计一个人脸表情识别网络,该网络在训练时同时接收训练集中的真实人脸表情图以及由人脸表情生成网络产生的随机人脸表情图,使用一种类内损失来减少真实样本和生成样本之间的人脸表情特征差异性;同时还使用一种真实样本导向的梯度更新方法来促进生成样本的特征学习;最后根据训练好的人脸表情识别网络模型,从模型最后的柔性最大分类层得到最终的人脸表情识别结果。

    一种基于内外语义聚合的视频目标检测方法

    公开(公告)号:CN112966581A

    公开(公告)日:2021-06-15

    申请号:CN202110213113.X

    申请日:2021-02-25

    Applicant: 厦门大学

    Abstract: 一种基于内外语义聚合的视频目标检测方法,涉及计算机视觉技术。包括步骤:A.准备训练样本集,依次包括当前帧、支持帧,首先在当前序列随机选取一帧作为当前帧,再在当前帧附近随机选取几帧作为支持帧,为当前帧的训练提供丰富的时空信息。B.预处理训练样本集,对当前帧,支持帧进行随机翻转、裁剪等操作,进一步增大训练样本多样性。C.在每帧内进行内部语义聚合,实现单个帧自身的空间语义增强。D.联合三帧进行外部语义聚合,实现三帧时空信息的语义增强。E.对经过内外语义聚合的当前帧特征进行分类和回归,得到最后的检测结果,包括检测框和预测所属类别。可以有效地聚合视频中的时空语义信息,从而有效地提高目标检测器的性能。

Patent Agency Ranking