-
公开(公告)号:CN107886942B
公开(公告)日:2021-09-28
申请号:CN201711055574.9
申请日:2017-10-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于局部惩罚随机谱回归的语音信号情感识别方法,对带有情感信息的语段信号样本进行副语言特征提取、数据映射、局部惩罚嵌入图设计和图分解、回归、分类器分类判决。其中在数据映射阶段,使用了随机生成点进行非线性特征映射;在局部惩罚嵌入图设计和图分解阶段,使用了局部惩罚嵌入图,以加大对类间边缘样本对之间的惩罚权重,生成训练样本的虚拟坐标。与现有方法相比,本发明的方法在语音信号情感识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103531208B
公开(公告)日:2016-08-03
申请号:CN201310534910.3
申请日:2013-11-01
Applicant: 东南大学
IPC: G10L25/63
Abstract: 本发明公开了一种航天应激环境下的基于短时记忆权重融合的语音情感识别方法。本发明根据心理学中的短时记忆遗忘规律,提取语音帧的回忆正确率的先验概率;回忆正确率的先验概率,与调节系数共同构成帧的重要性权重;基于各帧的重要性权重,计算语音段的判决融合权重;各语音段进行情感识别;根据判决融合权重,进行情感融合,获得最终的识别结果。本发明的方法可以有效地提高与文本相关的说话人识别系统的识别正确率,此外系统对噪声也具有较好的鲁棒性。
-
公开(公告)号:CN108175426B
公开(公告)日:2020-06-02
申请号:CN201711315604.5
申请日:2017-12-11
Applicant: 东南大学
IPC: A61B5/16
Abstract: 本发明公开了一种基于深度递归型条件受限玻尔兹曼机的测谎方法,首先在连续语音段落中,利用条件受限玻尔兹曼机对时间序列具有良好的建模特性和简易的推理过程,对训练样本进行建模,得到说话人是否说谎的高阶统计信息;接着用该高阶统计信息和训练样本的标签对递归神经网络进行有监督的参数训练。在获得条件受限玻尔兹曼机和递归神经网络的初始化参数后,将这两个基本网络单元由下至上搭建而成;并在验证数据集上,基于最小二乘回归微调递归神经网络的参数;利用建立的网络,对说话人的语音信号特征进行测试。本发明能够自动得到测谎的结果,且具有相对较高的识别率,该方法对评测者的专业知识和技能要求不高,有较高的测试效率。
-
公开(公告)号:CN104537386B
公开(公告)日:2019-04-19
申请号:CN201410677256.6
申请日:2014-11-21
Applicant: 东南大学
Abstract: 本发明公开了一种基于级联混合高斯形状模型的多姿态图像特征点配准方法。该方法针对任意一种图像特征点定位器的定位结果,本发明中的配准方法能够显著提高其定位精度。本发明中所述的配准方法主要包括以下步骤:一、在多姿态的图像数据库上进行混合高斯形状模型的建模;二、采用一种级联的混合高斯形状模型对特征点进行校准,在每一级中,遍历特征点可能组成的形状,通过计算该形状对应的似然概率的阈值来判断出错误定位的特征点;三、采用正确特征点的高斯分布条件概率进行错误特征点的纠错。
-
公开(公告)号:CN104050963B
公开(公告)日:2017-02-15
申请号:CN201410283309.6
申请日:2014-06-23
Applicant: 东南大学
Abstract: 本发明公开了一种基于情感数据场的连续语音情感预测算法,首先根据数据场理论,利用情感数据场中势函数建立不同语音情感特征向量之间的联系;其次,在短时间上选取多个语音情感特征向量,用群体智能算法在情感数据场中研究各语音情感特征向量的变化趋势,将这种变化趋势作为语音情感的识别结果。实验表明,本发明的方法可以有效的解决语音情感识别中存在的情感跟踪延迟问题并有效预测说话人情感的变化。
-
公开(公告)号:CN103544963B
公开(公告)日:2016-09-07
申请号:CN201310549224.3
申请日:2013-11-07
Applicant: 东南大学
Abstract: 本发明公开了一种基于核半监督判别分析的语音情感识别方法,对经预处理的语音样本中语音情感特征提取后,进行特征筛选、KSDA维数约简和分类。在训练阶段,对全监督训练样本集使用KSDA进行维数约简,将表示训练样本不同关系信息的嵌入图结合起来,并使用核化数据映射,实现对语音情感特征维数约简的优化,再用低维样本训练多类SVM分类器;在测试阶段,依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式,对各测试样本获取其低维特征,再使用训练得到的分类器进行分类判决,得到测试样本的类别。与现有方法相比,本发明的方法在语音情感特征维数约简中增加了降维的有效性,使语音情感识别系统的识别率性能得到了提升。
-
公开(公告)号:CN104156628A
公开(公告)日:2014-11-19
申请号:CN201410437529.X
申请日:2014-08-29
Applicant: 东南大学
IPC: G06F19/00
Abstract: 本发明公开了一种基于多核学习判别分析的舰船辐射信号识别方法,对舰船辐射信号样本依次进行预处理、听觉模型特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于多核学习判别分析的方法,利用交替优化,分别对核映射系数和线性多核组合系数,在用图嵌入形式表示的核判别分析优化目标下,进行优化运算。与现有方法相比,本发明的方法在舰船辐射信号的识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103854645A
公开(公告)日:2014-06-11
申请号:CN201410078383.4
申请日:2014-03-05
Applicant: 东南大学
IPC: G10L15/08 , G10L21/003 , G10L25/63
Abstract: 本发明公开了一种基于说话人惩罚的独立于说话人语音情感识别方法,对语音信号样本依次进行预处理、语音情感原始特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于说话人惩罚的图嵌入学习方法,利用说话人标签信息,分别针对属于同一类情感类别但说话人不同,以及属于同一说话人但分属于不同情感类别的语音信号样本对,在图嵌入理论的基础上利用已有理论,进行组合优化运算。与现有方法相比,本发明的方法在独立于说话人的语音情感识别中,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103544963A
公开(公告)日:2014-01-29
申请号:CN201310549224.3
申请日:2013-11-07
Applicant: 东南大学
Abstract: 本发明公开了一种基于核半监督判别分析的语音情感识别方法,对经预处理的语音样本中语音情感特征提取后,进行特征筛选、KSDA维数约简和分类。在训练阶段,对全监督训练样本集使用KSDA进行维数约简,将表示训练样本不同关系信息的嵌入图结合起来,并使用核化数据映射,实现对语音情感特征维数约简的优化,再用低维样本训练多类SVM分类器;在测试阶段,依次使用训练阶段特征筛选得到的特征及维数约简得到的数据映射方式,对各测试样本获取其低维特征,再使用训练得到的分类器进行分类判决,得到测试样本的类别。与现有方法相比,本发明的方法在语音情感特征维数约简中增加了降维的有效性,使语音情感识别系统的识别率性能得到了提升。
-
公开(公告)号:CN103531198A
公开(公告)日:2014-01-22
申请号:CN201310534319.8
申请日:2013-11-01
Applicant: 东南大学
Abstract: 本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。
-
-
-
-
-
-
-
-
-