-
公开(公告)号:CN113297383B
公开(公告)日:2023-08-04
申请号:CN202110695067.1
申请日:2021-06-22
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/33 , G06F40/30 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种基于知识蒸馏的语音情感分类方法,涉及语音智能处理技术,该方法包括:将样本文本数据预处理后输入向量提取网络提取文本词嵌入向量;将文本词嵌入向量输入预设的分类模型;将样本文本数据进行语音合成转换;将TTS语音数据输入语音特征提取模块;将语音时域及频域特征输入预设的分类模型,使用交叉熵损失函数对预设的分类模型进行语音情感分类预测训练;将文本情感分类软标签输入所述预设的分类模型并使用预设的知识蒸馏损失函数进行语音情感分类预测训练,使所述TTS语音数据的情感类别预测趋近于所述样本文本数据的情感分布,得到训练后的分类模型。训练后的分类模型可以对输入的语音数据进行语音情感分类。
-
公开(公告)号:CN113297383A
公开(公告)日:2021-08-24
申请号:CN202110695067.1
申请日:2021-06-22
Applicant: 苏州大学
Abstract: 本申请涉及一种基于知识蒸馏的语音情感分类方法,涉及语音智能处理技术,该方法包括:将样本文本数据预处理后输入向量提取网络提取文本词嵌入向量;将文本词嵌入向量输入预设的分类模型;将样本文本数据进行语音合成转换;将TTS语音数据输入语音特征提取模块;将语音时域及频域特征输入预设的分类模型,使用交叉熵损失函数对预设的分类模型进行语音情感分类预测训练;将文本情感分类软标签输入所述预设的分类模型并使用预设的知识蒸馏损失函数进行语音情感分类预测训练,使所述TTS语音数据的情感类别预测趋近于所述样本文本数据的情感分布,得到训练后的分类模型。训练后的分类模型可以对输入的语音数据进行语音情感分类。
-