一种跨语言的语音情感识别方法

    公开(公告)号:CN103578481B

    公开(公告)日:2016-04-27

    申请号:CN201210256381.0

    申请日:2012-07-24

    Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。

    一种跨语言的语音情感识别方法

    公开(公告)号:CN103578481A

    公开(公告)日:2014-02-12

    申请号:CN201210256381.0

    申请日:2012-07-24

    Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。

    负面情绪检测中的基于上下文修正的语音情感识别方法

    公开(公告)号:CN103578480B

    公开(公告)日:2016-04-27

    申请号:CN201210256326.1

    申请日:2012-07-24

    Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。

    负面情绪检测中的基于上下文修正的语音情感识别方法

    公开(公告)号:CN103578480A

    公开(公告)日:2014-02-12

    申请号:CN201210256326.1

    申请日:2012-07-24

    Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。

    一种基于多核学习判别分析的舰船辐射信号识别方法

    公开(公告)号:CN104156628B

    公开(公告)日:2017-05-31

    申请号:CN201410437529.X

    申请日:2014-08-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多核学习判别分析的舰船辐射信号识别方法,对舰船辐射信号样本依次进行预处理、听觉模型特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于多核学习判别分析的方法,利用交替优化,分别对核映射系数和线性多核组合系数,在用图嵌入形式表示的核判别分析优化目标下,进行优化运算。与现有方法相比,本发明的方法在舰船辐射信号的识别方面,能够有效地提升系统的识别性能。

    一种基于说话人惩罚的独立于说话人语音情感识别方法

    公开(公告)号:CN103854645B

    公开(公告)日:2016-08-24

    申请号:CN201410078383.4

    申请日:2014-03-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于说话人惩罚的独立于说话人语音情感识别方法,对语音信号样本依次进行预处理、语音情感原始特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于说话人惩罚的图嵌入学习方法,利用说话人标签信息,分别针对属于同一类情感类别但说话人不同,以及属于同一说话人但分属于不同情感类别的语音信号样本对,在图嵌入理论的基础上利用已有理论,进行组合优化运算。与现有方法相比,本发明的方法在独立于说话人的语音情感识别中,能够有效地提升系统的识别性能。

    基于特征空间自适应投影的语音情感识别方法

    公开(公告)号:CN102779510B

    公开(公告)日:2013-12-18

    申请号:CN201210250571.1

    申请日:2012-07-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。

    基于特征空间自适应投影的语音情感识别方法

    公开(公告)号:CN102779510A

    公开(公告)日:2012-11-14

    申请号:CN201210250571.1

    申请日:2012-07-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。

    一种基于Gabor时频分析的耳语增强方法

    公开(公告)号:CN102737643A

    公开(公告)日:2012-10-17

    申请号:CN201110092780.3

    申请日:2011-04-14

    Applicant: 东南大学

    Abstract: 本发明提供一种基于Gabor时频分析的耳语增强方法,包括如下步骤:第1步:利用Gabor时频分析理论和方法提取耳语音对数谱幅度,第2步,基于无语音概率的耳语音噪声谱估计,第3步,获取纯净耳语音的功率谱,并求增强后的耳语音信号;本发明基于Gabor变换下的耳语音功率谱根据抽样率的不同有着多样的时频分析细腻度,从而可以根据不同的语音类型采用不同的抽样率,使算法普适性更强。

Patent Agency Ranking