一种基于正态分布规律的矢量量化方法

    公开(公告)号:CN106898357A

    公开(公告)日:2017-06-27

    申请号:CN201710083683.5

    申请日:2017-02-16

    Abstract: 本发明公开了一种基于正态分布规律的矢量量化方法,在码本生成中,首先将训练样本集的特征中心作为初始码字,然后再对初始码字进行码字分裂,当码字为非首次分裂时,将各码字的码字宽度和隶属于各码字中的训练样本数作乘积,将上述乘积最大的L个码字选取出来作为待分裂码字,得到新的码字均值,实现码字分裂,在码字每完成一次分裂后,进入数据划分阶段;数据划分时将各码字描述为正态分布,计算每个训练样本对各个码字隶属度,划分胞腔更新码字;判断量化失真度是否收敛,若否,继续数据划分;若是,则判断码字总量是否达到一定值,若否,则继续码字分裂,若是,则输出最终码本。本发明方法能够提高码字分裂准确性,降低了矢量量化的误差。

    基于纯净语音与背景噪声两极建模的音频类型检测方法

    公开(公告)号:CN106448661A

    公开(公告)日:2017-02-22

    申请号:CN201610847518.8

    申请日:2016-09-23

    Abstract: 本发明提供一种基于纯净语音与背景噪声两极建模的音频类型检测方法,包括步骤:S1、构建纯净语音GMM模型以及纯粹背景噪声GMM模型;S2、计算纯净语音模型自身各高斯混元间的距离,判断高斯混元是否位于特征重叠空间;S3、剔除位于特征重叠空间中的高斯混元,重新构建纯净语音统计模型、纯粹背景噪声统计模型;S4、计算新的纯净语音统计模型、纯粹背景噪声统计模型的概率,以及估算音频样本信噪比;S5、根据计算得到的概率以及估算信噪比,构建特征矢量且利用SVM模型进行判决,将样本判别为纯净语音、背景噪声或含噪声语音。本发明在降低GMM-SVM运算量的同时,能有效地区分纯净语音、纯净背景噪声和含噪声语音。

Patent Agency Ranking