基于半监督对抗变分自编码的语音情感识别方法及系统

    公开(公告)号:CN112863494A

    公开(公告)日:2021-05-28

    申请号:CN202110070151.4

    申请日:2021-01-19

    Applicant: 湖南大学

    Abstract: 本发明公开一种基于半监督对抗变分自编码的语音情感识别方法及系统,该方法步骤包括:S1.构建生成式对抗网络,并结合半监督变分自编码模型以及生成式对抗网络构建语音情感识别模型,其中将输入数据中带情感标签数据与对应的情感标签作为输入,以及将输入数据中无情感标签数据作为情感标签属性缺失类型处理,由生成式对抗网络学习输入数据在隐含层的特征概率分布,构建得到SSAVAE模型;S2.使用训练集对构建得到的SSAVAE模型进行训练;S3.输入待处理语音情感数据,将待处理语音情感数据输入至训练后的SSAVAE模型中,得到情感识别结果。本发明具有实现方法简单、识别精度高、泛化能力且抗数据扰动性能好等优点。

    基于半监督对抗变分自编码的语音情感识别方法及系统

    公开(公告)号:CN112863494B

    公开(公告)日:2023-01-06

    申请号:CN202110070151.4

    申请日:2021-01-19

    Applicant: 湖南大学

    Abstract: 本发明公开一种基于半监督对抗变分自编码的语音情感识别方法及系统,该方法步骤包括:S1.构建生成式对抗网络,并结合半监督变分自编码模型以及生成式对抗网络构建语音情感识别模型,其中将输入数据中带情感标签数据与对应的情感标签作为输入,以及将输入数据中无情感标签数据作为情感标签属性缺失类型处理,由生成式对抗网络学习输入数据在隐含层的特征概率分布,构建得到SSAVAE模型;S2.使用训练集对构建得到的SSAVAE模型进行训练;S3.输入待处理语音情感数据,将待处理语音情感数据输入至训练后的SSAVAE模型中,得到情感识别结果。本发明具有实现方法简单、识别精度高、泛化能力且抗数据扰动性能好等优点。

    基于DIS-NV特征的情感识别方法

    公开(公告)号:CN107316654A

    公开(公告)日:2017-11-03

    申请号:CN201710607464.2

    申请日:2017-07-24

    Applicant: 湖南大学

    CPC classification number: G10L25/63 G10L15/063 G10L15/08 G10L15/14 G10L15/183

    Abstract: 本发明公开一种基于DIS-NV特征的情感识别方法,步骤包括:S1.选取具有不流利特性的情感词作为DIS特征词、以及具有非语言特性的发声类型作为NV特征类,构建得到DIS-NV特征集;S2.获取训练语音文本,分别与DIS-NV特征集进行匹配,提取对应的DIS-NV特征值,并采用BLSTM模型进行训练,得到BLSTM分类模型;S3.获取待识别语音文本,将待识别语音文本与DIS-NV特征集进行匹配,提取对应的DIS-NV特征值,并使用BLSTM分类模型进行识别,输出情感识别结果。本发明能够充分利用不流利、非语言特性的语音文本实现情感识别,且具有实现方法简单、识别效率以及精度高等优点。

Patent Agency Ranking