-
公开(公告)号:CN118629433A
公开(公告)日:2024-09-10
申请号:CN202410858176.4
申请日:2024-06-28
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于时空门控交互的语音情感识别方法,属于语音情感识别领域。该方法为:1)将样本划分为训练集与测试集,同时训练集还将分出一定比例作为验证集;2)构建时空门控交互主干网络;3)设计门控交互单元用于语音时空特征交互;4)设计利用验证集动态更新学习率策略;5)与多种不同方法作对比实验,验证所提方法的有效性。本发明专利创新性地引入时空门控交互网络,旨在精准提取语音中的情感特征。通过精心设计的门控单元,本方法实现了从浅层到深层次网络的时空特征高效交互,有效克服了语音潜在情感提取的困难,并削弱了个性化对语音情感表达的影响。这一独特的技术显著提升了语音情感识别的准确率,并大幅增强了模型的泛化能力。
-
公开(公告)号:CN118430586A
公开(公告)日:2024-08-02
申请号:CN202410490790.X
申请日:2024-04-23
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于时空频谱特征与软标签纠正的语音情感识别方法,属于语音情感识别领域。该方法为:1)划分样本为清晰样本(即有情感主标签的语音样本)与模糊样本(即无情感主标签的样本);2)构建时空主干网络提取语音的时空特征;3)确定软标签纠正策略,为模糊语音样本的使用提供有效方案;4)设计用于连续变量的类间差异损失函数以便用于模型训练参数更新;5)通过与多种不同方法进行对比,验证所提方法的有效性。本发明专利考虑在模型训练过程同时进行软标签纠正,实现语音的动态情感特征提取,缓解情感表达存在的模糊性与情感认知存在的主观性对语音情感识别的误导。该方法能够实时对模糊语音的软标签进行纠正,增加语音情感识别模型的泛化能力。
-