基于非稳态音频增强和多尺度注意力的声纹识别方法及系统

    公开(公告)号:CN116863944A

    公开(公告)日:2023-10-10

    申请号:CN202310838750.5

    申请日:2023-07-10

    Abstract: 本发明公开了一种基于非稳态音频增强和多尺度注意力的声纹识别方法及系统,方法具体步骤如下:步骤S1、将输入的语音信号进行基于频谱门控的非平稳降噪;步骤S2、经非平稳降噪后的语音信号输入基于卷积与长短期记忆的实时因果语音增强网络中;步骤S3、将经过语音增强后的语音信号进行训练,得到分类文本结果;将文本结果和对应标签计算,得到损失;根据损失得到调节模型参数;直到训练结果准确性收敛,结束训练;剔除最后一层分类层,将模型的多维特征向量取出;步骤S4、取出最后一层的特征向量,分别对不同的特征向量进行余弦相似度的计算和指数型权重的划分,获得无学习样本下的语音识别准确率。

Patent Agency Ranking