一种基于知识蒸馏的文本无关说话人确认方法

    公开(公告)号:CN114239830A

    公开(公告)日:2022-03-25

    申请号:CN202111536219.X

    申请日:2021-12-15

    Inventor: 汪澜 李俊义

    Abstract: 本发明公开了一种基于知识蒸馏的文本无关说话人确认方法,步骤为:数据预处理,其由数据准备和数据封装两部分组成;特征提取,其由音频读取、信号预加重、特征转换、样本归一化四部分组成;学生模型设计,其由学生模型网络结构设计以及训练算法部分组成;模型性能评估,对设计的学生模型进行性能评估,通过直观的计算教师学生网络输出的speaker embedding间的余弦相似度来指导学生模型训练,使用ERR对学生模型进行性能评估。本发明可以有效的利用教师模型得到的先验知识指导学生网络进行训练,使得模型参数量较小的学生模型在模型参数量较大的教师网络的指导下达到接近于教师网络性能的目的,从而实现对说话人确认模型进行参数压缩的目的。

Patent Agency Ranking