-
公开(公告)号:CN109346084A
公开(公告)日:2019-02-15
申请号:CN201811092136.4
申请日:2018-09-19
Applicant: 湖北工业大学
CPC classification number: G10L17/005 , G10L17/02 , G10L17/04 , G10L17/18 , G10L17/22
Abstract: 本发明涉及一种基于深度堆栈自编码网络的说话人识别方法,S1:说话人特征提取;S2:堆栈自编码器的网络设计;S3:说话人识别与决策。本发明与传统说话人识别相比,将深度堆栈自编码网络与说话人识别系统模型相融合,结合堆栈自编码器的多层结构在提高评价模型的表征能力方面的显著效果,本发明的说话人识别方法在存在背景噪声的环境下能够有限提升系统的识别性能,在降低噪声对系统性能影响、提高系统噪声鲁棒性的同时,优化系统结构,使识别实时性得到有效增强。