-
公开(公告)号:CN118782102A
公开(公告)日:2024-10-15
申请号:CN202410965146.3
申请日:2024-07-18
Applicant: 南开大学
IPC: G10L25/69 , G10L19/022
Abstract: 本发明涉及计算机处理技术领域,特别是涉及一种不确定性感知的语音质量平均意见得分预测方法,用于自动评估合成音频质量。该方法包括以下步骤:步骤S101,利用异方差回归方法建模数据不确定性。步骤S102,引入标量参数对数据不确定性进行线性校准。步骤S103,通过多次前向传播来估计模型的不确定性。步骤S104,设置阈值进行选择性预测和域外样本检测,排除系统的不可靠预测。利用这些不确定性信息,可以实现选择性预测和域外样本检测,从而在复杂和多变的实际应用场景中提供更稳定和可靠的预测。
-
公开(公告)号:CN117591858A
公开(公告)日:2024-02-23
申请号:CN202311585304.4
申请日:2023-11-24
Applicant: 南开大学
IPC: G06F18/213 , G06F18/24 , G06N3/048 , G06N3/0464 , G06N3/08 , G06F16/35
Abstract: 本发明属于多模态情感识别领域和表征学习领域,更具体地涉及一种细粒度表征解耦学习的情感识别模型构建方法。首先,使用模态共享编码器和模态私有编码器提取模态的共享表征和私有表征。其次,使用细粒度对齐方法约束模态共享表征的学习,从而捕捉模态一致性。使用细粒度差异化方法来学习模态私有表征并增强其多样性。随后,使用细粒度预测方法以确保编码器输出表征的标签保持不变。最后,由跨模态融合方法构建更丰富的表示形式用于情感识别任务。
-