-
公开(公告)号:CN106898357B
公开(公告)日:2019-10-18
申请号:CN201710083683.5
申请日:2017-02-16
Applicant: 华南理工大学
IPC: G10L19/012 , G10L19/032 , G10L25/18 , G10L25/51
Abstract: 本发明公开了一种基于正态分布规律的矢量量化方法,在码本生成中,首先将训练样本集的特征中心作为初始码字,然后再对初始码字进行码字分裂,当码字为非首次分裂时,将各码字的码字宽度和隶属于各码字中的训练样本数作乘积,将上述乘积最大的L个码字选取出来作为待分裂码字,得到新的码字均值,实现码字分裂,在码字每完成一次分裂后,进入数据划分阶段;数据划分时将各码字描述为正态分布,计算每个训练样本对各个码字隶属度,划分胞腔更新码字;判断量化失真度是否收敛,若否,继续数据划分;若是,则判断码字总量是否达到一定值,若否,则继续码字分裂,若是,则输出最终码本。本发明方法能够提高码字分裂准确性,降低了矢量量化的误差。
-
公开(公告)号:CN107333018A
公开(公告)日:2017-11-07
申请号:CN201710373057.X
申请日:2017-05-24
Applicant: 华南理工大学
IPC: H04M9/08 , G10L21/0208 , G06K9/62
Abstract: 本发明公开了一种回声时延估计及追踪方法,所述方法基于SVM分类器中标记音的嵌入/检测来估算回声时延,简化了音频特征提取的过程,同时利用基于人耳听觉掩蔽效应的心理声学模型,对嵌入的标记音的位置、幅值进行控制,以达到嵌入后无听觉失真的目的,最大化保证了原始远端信号的完整性和准确性,另外,标记音的嵌入程序和检测程序交替执行,对于每一次嵌入和检测到的标记音,执行范围检验,根据检验结果对回声时延进行更新,实现了对回声时延的动态追踪,相较于传统的互相关算法,具有实时性高、鲁棒性强、计算复杂度低的优点,而且该方法不依赖背景噪声与远端信号的独立性假设,具有更高的可靠性。
-
公开(公告)号:CN106898357A
公开(公告)日:2017-06-27
申请号:CN201710083683.5
申请日:2017-02-16
Applicant: 华南理工大学
IPC: G10L19/012 , G10L19/032 , G10L25/18 , G10L25/51
Abstract: 本发明公开了一种基于正态分布规律的矢量量化方法,在码本生成中,首先将训练样本集的特征中心作为初始码字,然后再对初始码字进行码字分裂,当码字为非首次分裂时,将各码字的码字宽度和隶属于各码字中的训练样本数作乘积,将上述乘积最大的L个码字选取出来作为待分裂码字,得到新的码字均值,实现码字分裂,在码字每完成一次分裂后,进入数据划分阶段;数据划分时将各码字描述为正态分布,计算每个训练样本对各个码字隶属度,划分胞腔更新码字;判断量化失真度是否收敛,若否,继续数据划分;若是,则判断码字总量是否达到一定值,若否,则继续码字分裂,若是,则输出最终码本。本发明方法能够提高码字分裂准确性,降低了矢量量化的误差。
-
公开(公告)号:CN107333018B
公开(公告)日:2019-11-15
申请号:CN201710373057.X
申请日:2017-05-24
Applicant: 华南理工大学
IPC: H04M9/08 , G10L21/0208 , G06K9/62
Abstract: 本发明公开了一种回声时延估计及追踪方法,所述方法基于SVM分类器中标记音的嵌入/检测来估算回声时延,简化了音频特征提取的过程,同时利用基于人耳听觉掩蔽效应的心理声学模型,对嵌入的标记音的位置、幅值进行控制,以达到嵌入后无听觉失真的目的,最大化保证了原始远端信号的完整性和准确性,另外,标记音的嵌入程序和检测程序交替执行,对于每一次嵌入和检测到的标记音,执行范围检验,根据检验结果对回声时延进行更新,实现了对回声时延的动态追踪,相较于传统的互相关算法,具有实时性高、鲁棒性强、计算复杂度低的优点,而且该方法不依赖背景噪声与远端信号的独立性假设,具有更高的可靠性。
-
-
-