一种基于增量学习的语种识别方法

    公开(公告)号:CN117935776A

    公开(公告)日:2024-04-26

    申请号:CN202410089667.7

    申请日:2024-01-23

    Applicant: 东北大学

    Abstract: 本发明的一种基于增量学习的语种识别方法,包括步骤1:对原始音频文件进行预处理,提取得到音频特征序列;步骤2:搭建基于Transformer的语种识别模型框架;步骤3:使用多语种数据集训练语种识别模型,采用交叉熵损失函数进行优化训练;步骤4:保持步骤3训练好的语种识别模型的结构和参数不变,在其解码端添加新预测层,构成新的语种识别模型;步骤5:将新的多语种数据集输入到新的语种识别模型中,得到旧预测层输出的预测的语种概率和新预测层输出的预测的语种概率;步骤6:设置新的损失函数,通过最小化损失函数来更新新的语种识别模型的参数;步骤7:使用随机梯度下降法训练新的语种识别模型,最终得到基于增量学习的语种识别模型。

Patent Agency Ranking