基于分层聚类的声码器线谱频率参数量化方法

    公开(公告)号:CN109448739A

    公开(公告)日:2019-03-08

    申请号:CN201811524849.3

    申请日:2018-12-13

    Abstract: 本发明公开了一种基于分层聚类的声码器线谱频率参数量化方法,包括:接收语音信号并按帧提取线谱频率参数和清浊音参数;将连续若干帧的线谱频率参数和清浊音参数分别联合,组成超帧线谱频率矢量和超帧清浊音矢量;对当前超帧清浊音矢量进行矢量量化,得到量化索引,其中,当前超帧和上一超帧对应的量化索引联合组成当前转移模式;分别计算该转移模式下的线谱频率参数的直流分量,并训练预测系数,得到该转移模式下当前超帧余量线谱频率参数;根据当前转移模式选择对应量化码本,对余量线谱频率参数进行多级矢量量化,得到量化后的余量线谱频率参数。该方法考虑了线谱频率参数在不同状态下的统计特性差异,能够提高线谱频率参数的量化质量。

    基于支持向量机在语音解码端重构子带清浊音度参数的方法

    公开(公告)号:CN108461088A

    公开(公告)日:2018-08-28

    申请号:CN201810232462.4

    申请日:2018-03-21

    Abstract: 本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。

    基于噪声背景分类的语音增强方法及系统

    公开(公告)号:CN113160844A

    公开(公告)日:2021-07-23

    申请号:CN202110459982.0

    申请日:2021-04-27

    Abstract: 本发明公开了基于噪声背景分类的语音增强方法及系统,包括:获取待处理语音信号;对待处理语音信号进行特征提取;将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;根据噪声背景标签,选择对应标签的训练后的生成器;将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。本方法选择了提取带噪语音的梅尔频率倒谱系数输入分类器对噪声背景进行分类,对分类好的语音使用同一个模型内针对此类噪声背景的生成对抗网络来实现语音增强,此方法在面对多场景下的语音增强都有较好的效果。

    基于生成对抗网络的语音私密度掩蔽信号生成方法及系统

    公开(公告)号:CN112581929A

    公开(公告)日:2021-03-30

    申请号:CN202011450095.9

    申请日:2020-12-11

    Abstract: 本申请公开了基于生成对抗网络的语音私密度掩蔽信号生成方法及系统,包括:生成随机噪声信号;将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号。此掩蔽信号与会议室内说话人发音特点类似,自然度更高且对窃听人员来说掩蔽信号的内容没有实际意义,从而达到对窃听者进行干扰的目的。该发明不但解决了常见的掩蔽信号掩蔽效率低、会对说话人有负面影响的问题,同时也节约了人力、物力,具有更高的环境适应性。

    基于支持向量机在语音解码端重构子带清浊音度参数的方法

    公开(公告)号:CN108461088B

    公开(公告)日:2019-11-19

    申请号:CN201810232462.4

    申请日:2018-03-21

    Abstract: 本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。

    基于变分模态分解和感知哈希的语音端点检测方法

    公开(公告)号:CN109616143A

    公开(公告)日:2019-04-12

    申请号:CN201811526264.5

    申请日:2018-12-13

    Abstract: 本发明公开了一种基于变分模态分解和感知哈希的语音端点检测方法,该方法包括:接收输入语音信号;将输入语音信号进行VMD分解,将VMD分解后的固有模态函数分别进行短时时频分析,得到时频分析矩阵,根据感知哈希算法计算时频分析矩阵的感知哈希值;将输入语音信号VMD分解后时频分析矩阵的感知哈希值与环境噪声VMD分解后时频分析矩阵的感知哈希值进行比较,判断输入语音信号的语音段和噪声段。

Patent Agency Ranking