一种不确定性感知的语音质量平均意见得分预测方法

    公开(公告)号:CN118782102A

    公开(公告)日:2024-10-15

    申请号:CN202410965146.3

    申请日:2024-07-18

    Applicant: 南开大学

    Abstract: 本发明涉及计算机处理技术领域,特别是涉及一种不确定性感知的语音质量平均意见得分预测方法,用于自动评估合成音频质量。该方法包括以下步骤:步骤S101,利用异方差回归方法建模数据不确定性。步骤S102,引入标量参数对数据不确定性进行线性校准。步骤S103,通过多次前向传播来估计模型的不确定性。步骤S104,设置阈值进行选择性预测和域外样本检测,排除系统的不可靠预测。利用这些不确定性信息,可以实现选择性预测和域外样本检测,从而在复杂和多变的实际应用场景中提供更稳定和可靠的预测。

    基于质量对比学习的合成音质量评测模型的训练方法

    公开(公告)号:CN116524958A

    公开(公告)日:2023-08-01

    申请号:CN202310623577.7

    申请日:2023-05-30

    Applicant: 南开大学

    Abstract: 本发明属于计算机处理技术领域,更具体地,涉及一种基于质量对比学习的合成音质量评测模型的训练方法。该方法包括以下步骤:步骤S101,引入在大规模数据集上训练的模型作为预训练模型;步骤S102,设置中间任务,并定义正负样本,进行数据集中的正负样本划分;步骤S103,定义带权重的损失函数,控制训练目标,调整正负样本对表征的距离;步骤S104,在预训练模型基础上增加中间任务头,并按照上述规则进行训练;步骤S105,保留步骤S104阶段训练得到的特征提取部分,增加下游任务头,以最小化预测分数和标签分数的均方误差为目标进行训练。

Patent Agency Ranking