基于TF-LSTM的CFFD提取方法、语音情感识别方法及系统

    公开(公告)号:CN109036467A

    公开(公告)日:2018-12-18

    申请号:CN201811258369.7

    申请日:2018-10-26

    CPC classification number: G10L25/63 G10L25/03 G10L25/18 G10L25/30

    Abstract: 本发明公开了基于TF‑LSTM的CFFD提取方法、语音情感识别方法及系统,其中基于TF‑LSTM的语音情感识别系统包括CFTD生成模块,用于根据预先提取的语音信号的时域上下文信息,生成CFTD;混合深度神经网络模型构造模块,用于构造混合深度神经网络模型;CFFD提取模块,用于将预先提取的256x256维的频域特征输入到构造的混合深度神经网络模型提取;分类器训练模块:用于将CFTD和CFFD两种特征进行融合,训练线性SVM分类器,获得最终的语音情感识别结果。本发明融合了两种深度特征信息包括时域特征和频域特征,以提高语音情感识别的准确性;采用一维卷积神经网络提取时域底层特征,通过多个LSTM模块学习语音情感信息,较好的得到了时域情感信息的上下文特征。

    基于TF-LSTM的CFFD提取方法、语音情感识别方法及系统

    公开(公告)号:CN109036467B

    公开(公告)日:2021-04-16

    申请号:CN201811258369.7

    申请日:2018-10-26

    Abstract: 本发明公开了基于TF‑LSTM的CFFD提取方法、语音情感识别方法及系统,其中基于TF‑LSTM的语音情感识别系统包括CFTD生成模块,用于根据预先提取的语音信号的时域上下文信息,生成CFTD;混合深度神经网络模型构造模块,用于构造混合深度神经网络模型;CFFD提取模块,用于将预先提取的256x256维的频域特征输入到构造的混合深度神经网络模型提取;分类器训练模块:用于将CFTD和CFFD两种特征进行融合,训练线性SVM分类器,获得最终的语音情感识别结果。本发明融合了两种深度特征信息包括时域特征和频域特征,以提高语音情感识别的准确性;采用一维卷积神经网络提取时域底层特征,通过多个LSTM模块学习语音情感信息,较好的得到了时域情感信息的上下文特征。

Patent Agency Ranking