-
公开(公告)号:CN117316189A
公开(公告)日:2023-12-29
申请号:CN202311332476.0
申请日:2023-10-13
Applicant: 之江实验室
Abstract: 本说明书提供的一种基于语音情感识别的业务执行方法及装置,将获取到的样本音频数据输入到过渡模型中包含的情感提取层、语义提取层以及声纹提取层,以从样本音频数据中相应地提取出情感特征、语义特征及声纹特征。将情感特征、语义特征和声纹特征输入过渡模型的编码层,得到编码特征。将该编码特征输入到过渡模型的解码层,得到预测频谱特征。以最小化预测频谱特征与样本音频数据的频谱特征标签之间的偏差为优化目标,至少对过渡模型中包含的情感提取层进行训练。通过训练后的过渡模型中的情感提取层以及预设的情感类型分类器,构建语音情感识别模型,以通过该语音情感识别模型对用户的语音进行情感识别,并根据情感识别结果执行目标业务。
-
公开(公告)号:CN116434787B
公开(公告)日:2023-09-08
申请号:CN202310705248.7
申请日:2023-06-14
Applicant: 之江实验室
Abstract: 本说明书公开了一种语音情感识别的方法、装置、存储介质及电子设备,获取目标语音,从该目标语音中选取若干个预设长度的语音片段,将各语音片段及该目标语音分别输入预先训练的情感预测模型,获取与各语音片段对应的局部情感预测结果及该目标语音的全局情感预测结果,将该全局情感预测结果与至少一个局部情感预测结果进行融合,得到优化后的全局情感预测结果,根据该优化后的全局情感预测结果,确定该目标语音的最终情感预测结果。本方法通过将模型可输出局部情感预测结果,并且通过将全局情感预测结果与局部情感预测结果进行融合,以优化全局情感预测结果,提高最终情感预测结果的准确率。
-
公开(公告)号:CN116434787A
公开(公告)日:2023-07-14
申请号:CN202310705248.7
申请日:2023-06-14
Applicant: 之江实验室
Abstract: 本说明书公开了一种语音情感识别的方法、装置、存储介质及电子设备,获取目标语音,从该目标语音中选取若干个预设长度的语音片段,将各语音片段及该目标语音分别输入预先训练的情感预测模型,获取与各语音片段对应的局部情感预测结果及该目标语音的全局情感预测结果,将该全局情感预测结果与至少一个局部情感预测结果进行融合,得到优化后的全局情感预测结果,根据该优化后的全局情感预测结果,确定该目标语音的最终情感预测结果。本方法通过将模型可输出局部情感预测结果,并且通过将全局情感预测结果与局部情感预测结果进行融合,以优化全局情感预测结果,提高最终情感预测结果的准确率。
-
-