-
公开(公告)号:CN117219129A
公开(公告)日:2023-12-12
申请号:CN202311234417.X
申请日:2023-09-22
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L25/87 , G10L25/30 , G10L21/0232 , G10L21/0316
Abstract: 本发明公开了一种语音端点检测方法、装置、终端设备以及存储介质,包括:获取带噪语音的语音信号,并根据所述语音信号生成对应的幅度矩阵;将语音信号输入至预设的前置降噪模型中,以使前置降噪模型输出所述带噪语音对应的降噪结果;将降噪结果与所述幅度矩阵进行拼接,得到拼接结果;将拼接结果输入至预设的语音端点检测模型中,以使语音端点检测模型根据所述拼接结果进行语音端点检测,生成对应的第一VAD序列;根据第一VAD序列与所述降噪结果,生成降噪语音的语音端点检测结果。本发明能够通过改变语音检测模型的输入,简化模型并减轻模型运行时的运算量,使语音端点检测模型能够在更低性能的平台上实时运行。