-
公开(公告)号:CN105047194B
公开(公告)日:2018-08-28
申请号:CN201510450338.1
申请日:2015-07-28
Applicant: 东南大学
Abstract: 本发明公开了一种用于语音情感识别的自学习语谱图特征提取方法,首先对已知情感的标准语料库中的语音进行预处理,得到量化后的语谱图灰度图像;然后计算所得到的语谱图灰度图像的Gabor语谱图;再采用可辨别特征学习算法对提取到的LBP统计直方图进行训练,构建不同尺度、不同方向下的全局显著性模式集合;最后采用全局显著性集合对语音不同尺度、不同方向下Gabor图谱的LBP统计直方图进行特征选择,得到处理后的统计直方图,将N个统计直方图级联,得到适合情感分类的语音情感特征。本发明提出的情感特征可以较好地识别不同种类的情感,识别率显著优于现有的声学特征。
-
公开(公告)号:CN105307093A
公开(公告)日:2016-02-03
申请号:CN201510835800.X
申请日:2015-11-26
Applicant: 东南大学
IPC: H04R25/00
Abstract: 本发明公开了一种自适应的听力补偿方法,本发明包括以下步骤:首先利用gammatone滤波器组对输入信号进行多通道分解,然后根据通道内信号的动态范围以及听损患者的听觉范围确定补偿方法,若通道信号经线性增益处理后仍在患者的听觉范围内则使用线性放大进行听力补偿以减小畸变,否则使用动态范围压缩进行补偿以增加可听度。另外,为减小动态范围压缩带来的信号畸变,提高噪声环境下输出信号的信噪比,采用自适应压缩方法进行听力补偿,使压缩比尽量接近于1。本发明相比已有的听力补偿方法,本发明补偿后的语音可懂度更高,具有很强的实用性。
-