-
公开(公告)号:CN118298856A
公开(公告)日:2024-07-05
申请号:CN202410403377.5
申请日:2024-04-03
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于迁移学习和跨场景知识的语音信号抑郁检测方法,属于语音处理及模式识别领域。该方法包括:收集跨场景语音数据集并从中提取语音生物标志物,并通过生物标志物对骨干网络进行分类训练,得到预训练的骨干网络;获取抑郁语音数据集并进行预处理;提取抑郁语音数据集的多模态语特征,至少包括声谱图和梅尔频率倒谱图;将抑郁语音数据集的声谱图和梅尔频率倒谱图进行特征级融合,并将得到的特征级融合特征输入预训练的骨干网络中进行迁移学习,得到语音复杂高维特征;通过统计函数获得统计特征向量,并对语音复杂高维特征与统计特征向量进行决策级融合;将决策级融合特征输入非线性预测网络,得到抑郁检测结果。