-
公开(公告)号:CN115471897A
公开(公告)日:2022-12-13
申请号:CN202211184244.0
申请日:2022-09-27
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于时空特征点运动注意力和子域自适应的跨库面部表情识别方法和系统。该方法包括以下步骤:截取数据库中视频的主要部分,满足相同长度并对其分帧;检测每个视频人脸、动作的时空特征点,计算每帧图片对应特征点处的权重值,形成面部时空特征点权重图;构建基于时空特征点运动注意力的深度子域自适应网络;将获得的表情提取特征输入SVM分类器、softmax层,输出得到分类结果。本发明充分利用时空特征点,有效结合人脸面部信息和运动信息,准确地反映肌肉运动出现的人脸区域,使用局部最大均值差异LMMD,减小源域和目标域之间的特征分布差异,通过子域自适应捕获到更多的细粒度信息,获得比深度域自适应的方法更好的识别效果。
-
公开(公告)号:CN111950592B
公开(公告)日:2022-09-23
申请号:CN202010660340.2
申请日:2020-07-10
Applicant: 南京邮电大学
IPC: G06V40/16 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种基于监督最小二乘多类核典型相关分析的多模态情感特征融合方法。其步骤:提取各模态特征所需要的样本;提取表情模态、语音模态及姿态模态的特征,构成特征矩阵;对提取的各模态特征进行去均值、归一化处理;使用监督最小二乘多类核典型相关分析方法进行多模态特征的融合;进行模型训练得到预测评估结果。本发明针对多类别情感分析问题,将波兰多模态数据库中所有人的各类情感整理分成7类情绪,分别为恐惧、惊讶、愤怒、悲伤、高兴、厌恶及平静,提出基于监督最小二乘多类核典型相关分析的方法来融合多种模态的特征数据,使用此方法计算各模态特征之间的相关性,计算特征之间的关联,能够使计算机更准确的分别人类的各种情绪。
-
公开(公告)号:CN109919061A
公开(公告)日:2019-06-21
申请号:CN201910145001.8
申请日:2019-02-27
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于稀疏典型相关分析的姿态和语音双模态情感识别方法,所述方法包括:1)在情感数据库中选取一定数量的样本;2)提取样本数据中的姿态特征和语音特征;3)对特征矩阵进行归一化处理;4)使用稀疏典型相关分析法,将特征矩阵进行融合,计算融合后的特征矩阵;5)将融合后的特征矩阵f放入支持向量机中进行情感识别。本发明加入稀疏典型处理后,不仅解决了双模态融合难的问题,还起到了特征降维的目的,解决了现有双模态特征层融合情感识别不佳的问题,提高了识别率。
-
公开(公告)号:CN109493291A
公开(公告)日:2019-03-19
申请号:CN201811265104.X
申请日:2018-10-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种自适应伽马校正的彩色图像对比度增强方法,该方法包括以下步骤:1、对输入的待增强图像做明度图像计算;2、利用明度图像计算概率密度函数和权重分布函数;3、计算权重分布函数的累积分布函数;4、构造自适应伽马参数,并对明度图像进行自适应伽玛校正;5、将校正后的图像转换回RGB彩色空间后得到增强后的结果图像。本发明能使图像对比度的增强自适应于像素强度,增强后的图像更自然,并且能够增强图像局部对比度。
-
公开(公告)号:CN108363969A
公开(公告)日:2018-08-03
申请号:CN201810105264.1
申请日:2018-02-02
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于移动终端的新生儿疼痛评估方法,该方法包括:(1)采集新生儿疼痛表情图像,将所述表情图像分类,将所述表情图像裁剪成a×a像素的彩色图像;(2)构建一个包含1个数据层、19个卷积层、1个池化层、1个全连接层和1个分类层的卷积神经网络;(3)将数据库分为训练集和验证集,对卷积神经网络进行训练,得到优化后的网络模型;(4)将训练好的网络模型移植到移动终端,生成新生儿疼痛评估应用程序;(5)开启所述新生儿疼痛评估应用程序,并将识别结果显示在移动终端上。本发明针对智能手机等移动终端的处理能力,优化设计了深度卷积神经网络的结构,采用深度学习方法来提取新生儿疼痛表情特征,分类识别准确率高。
-
公开(公告)号:CN108363962A
公开(公告)日:2018-08-03
申请号:CN201810071146.3
申请日:2018-01-25
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于多层次特征深度学习的人脸检测方法及系统。该方法包括获取训练集和验证集图像及图像的标签信息;将图像及标签输入深度卷积神经网络中,对网络进行训练和调优,得到人脸检测模型;将测试图像输入到训练好的模型进行人脸检测。其中神经网络包括用于提取第一层次特征的第一网络模块,用于提取第二层次特征的第二网络模块,以及包括两个支路,分别用于完成人脸分类任务和人脸位置坐标回归任务的第三网络模块。本发明在不同层次的特征图上进行检测,解决了现有方法中采用分阶段方式存在的效率慢、步骤繁琐和泛化能力差的问题,在保证高检测精度的同时也达到了实时检测的效果,并且对人脸图像的光照与遮挡问题具有很好的鲁棒性。
-
公开(公告)号:CN107392109A
公开(公告)日:2017-11-24
申请号:CN201710497593.0
申请日:2017-06-27
Applicant: 南京邮电大学
CPC classification number: G06K9/00302 , G06N3/0454 , G06N3/08
Abstract: 本发明涉及一种基于深度神经网络的新生儿疼痛表情识别方法,通过引入基于卷积神经网络(CNN)和长短时记忆(LSTM)网络的深度学习方法,将其运用于新生儿疼痛表情识别工作中,能够有效识别出新生儿处于安静、啼哭状态以及致痛性操作引起轻度疼痛、剧烈疼痛等表情;其中,通过引入深度神经网络来提取视频片段的时域和空域特征,突破了传统的人工设计与提取显式表情特征的技术瓶颈,并且提高了在面部受遮挡、姿态倾斜、光照变化等复杂情况下的识别率和鲁棒性。
-
公开(公告)号:CN106096641A
公开(公告)日:2016-11-09
申请号:CN201610397707.X
申请日:2016-06-07
Applicant: 南京邮电大学
CPC classification number: G06K9/6269 , G06K9/00302 , G06N3/126
Abstract: 本发明公开了一种基于遗传算法的多模态情感特征融合方法,属于信号处理与模式识别领域。包括以下内容:建立一个多模态情感数据库,然后对于所述数据库中的每个样本,提取多模态情感数据库样本的各模态情感特征,例如:面部表情特征、语音情感特征以及身体姿态特征等,构造多模态情感特征矩阵,将遗传算法用于多个模态的特征融合,包括基于遗传算法的特征选择、交叉以及重组,最后采用遗传算法对多模态情感特征进行F次迭代的特征选择和融合。本发明针对多模态情感分类识别,提出将遗传算法用于特征层融合,为基于特征层融合的多模态情感分类识别提供了一种新的有效途径。
-
公开(公告)号:CN119649161A
公开(公告)日:2025-03-18
申请号:CN202411596844.7
申请日:2024-11-11
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于深度神经网络优化算法的图像识别方法,涉及图像识别技术领域,包括:对图像数据集预处理,如自适应归一化、哈希编码标签等;按图嵌入技术编码网络结构并混合初始化权值阈值;融合算法优化特征,先粒子群初定再通道表征精细调;用训练集以改进反向传播及自适应矩估计算法训练,融合损失函数并动态调整学习率;在验证集计算多项指标评估并优化,如遗传算法搜结构、贝叶斯调学习率;将待识别图像输入优化后的网络,用集成识别方法得结果。本发明通过优化图像预处理、神经网络各环节及识别过程,提高图像质量与数据处理效率,准确确定特征,加快网络训练,全面评估优化网络,提高识别结果可靠性,提升图像识别精度和效率。
-
公开(公告)号:CN117953561A
公开(公告)日:2024-04-30
申请号:CN202311645112.8
申请日:2023-12-04
Applicant: 南京邮电大学
IPC: G06V40/16 , G06V20/40 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于Transformer和显著图的时空区三流微表情识别方法,包括:使用ResNet18从光流图中提取光流特征,将其传递给自注意力模块生成显著图;将显著图与微表情序列的峰值帧点乘,留下峰值帧中关键的微表情部分,利用ResNet18提取空间流特征后传递给自注意力模块;使用Vision Transformer从微表情起始帧中提取区域位置特征,包括人脸、五官区域位置信息;将光流特征、空间流特征和区域位置特征输入到Transformer,利用多头注意力机制进行特征融合,最后输入到softmax层进行分类。本发明最大程度上利用了微表情序列的起始帧和峰值帧,加强了各特征间的关联并且使得网络更加关注于人脸表情的细微运动变化。
-
-
-
-
-
-
-
-
-