-
公开(公告)号:CN118711593A
公开(公告)日:2024-09-27
申请号:CN202410724498.X
申请日:2024-06-05
Applicant: 北京理工大学
Abstract: 本发明公开的一种基于复杂场景的自适应声纹识别方法,属于语音领域的自适应声纹识别领域。本发明实现方法为:构建域自适应声纹模型,基于CN‑Celeb数据采用增量学习策略训练自适应声纹模型,通过模型蒸馏实现对已有源域知识的保留和对目标域知识的快速吸收,避免在域迁移过程中的灾难性遗忘;自适应声纹模型通过联合源域和目标域的半监督训练方法,优化自适应声纹模型在两个域上的表现,使自适应声纹模型能够适应新的数据分布,在复杂场景中基于训练好的域自适应声纹模型实现自适应声纹识别,有效克服灾难性遗忘现象。本发明能够提升对复杂场景中自适应声纹识别的准确率和鲁棒性。本发明尤其是能够提升在戏剧、歌声等多变环境下识别的准确率和鲁棒性。