一种基于半监督语音情感识别框架的深度情感聚类方法

    公开(公告)号:CN116230019A

    公开(公告)日:2023-06-06

    申请号:CN202211472628.2

    申请日:2022-11-17

    Applicant: 湖南大学

    Abstract: 本发明涉及一种基于半监督语音情感识别框架的深度情感聚类方法,属于语音情感识别技术领域,对输入的语料库中的音频进行预处理;使用Attn‑Convolution网络对预处理后的语音数据在空间上进行特征提取;使用BiGRU网络对预处理后的语音数据在时间上进行特征提取;将提取出的语音特征使用ADD函数进行特征融合;在聚类分类器模块中对未标记的数据集进行伪标签分配;在情感回归器中对每个句子i的语音片段sij进行回归预测;使用新的CCC‑CE联合损失作为回归器与分类器模型的损失函数。有益效果在于,使用较少未标记数据的模型框架比现有的半监督框架实现了更好的语音表示,并且在下游任务中优于最先进的方法。

    基于小波变换频域特征增强的图像翻译方法、装置及介质

    公开(公告)号:CN116596744A

    公开(公告)日:2023-08-15

    申请号:CN202310413128.X

    申请日:2023-04-17

    Applicant: 湖南大学

    Abstract: 本发明公开一种基于小波变换频域特征增强的图像翻译方法、装置及介质,该方法步骤包括:S01.在重构阶段时,将原始图像编码后进行解码得到重构图像,使用小波变换提取原始图像和重构图像的低频特征,并计算低频特征之间的差值,得到小波重构损失;S02.在翻译阶段时,将原始图像编码后进行翻译得到翻译图像,使用小波变换提取原始图像和翻译图像的高频特征,并计算高频特征之间的差值,得到小波翻译损失;S03.在模型训练阶段时,使用根据小波重构损失、小波翻译损失以及模型原始损失得到的整体损失约束生成器,以实现频域特征增强的图像翻译。本发明能够充分保留图像中的细节信息,有效提升翻译图像质量。

Patent Agency Ranking