-
公开(公告)号:CN107274887A
公开(公告)日:2017-10-20
申请号:CN201710322792.8
申请日:2017-05-09
Applicant: 重庆邮电大学
CPC classification number: G10L15/02 , G06K9/00523 , G10L15/20 , G10L17/02 , G10L19/02 , G10L19/26 , G10L25/24 , G10L25/45
Abstract: 本发明公开了一种基于融合特征MGFCC的说话人二次特征提取方法,该方法包括步骤:S1利用Mel滤波器对说话人语音进行处理得到MFCC特征;S2同时利用Gammatone滤波器对说话人语音进行处理得到GFCC特征;S3对两种特征在噪声环境下的各维特征区分度进行计算;S4统计两种特征的每一维特征处于最大FR值的次数;S5根据两种特征在噪声背景下的最大次数的不同进行特征融合;S6对融合特征进行微分和重组得到二次提取特征。本发明可以提取更能全面表达说话人的特征。
-
公开(公告)号:CN106653062A
公开(公告)日:2017-05-10
申请号:CN201710086400.2
申请日:2017-02-17
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种低信噪比环境下基于谱熵改进的语音端点检测方法,针对当前说话人识别中由于低信噪比环境下造成语音端点检测系统准确率不高的问题,提出了一种低信噪比环境下提高语音端点检测准确率的端点检测方法:(1)根据语音信号的特点对其进行信号的预处理;(2)根据语音信号每帧频带的划分,计算各子带谱熵和子带能量,最终得到各子带能熵比SEH;(3)设置合适门限值,然后结合中值滤波得到语音的起止位置;目的是通过中值滤波去除环境噪声的影响,以使语音信号更加平稳,提高低信噪比环境下端点检测的准确率。
-