基于两步排列熵的语音活动检测方法

    公开(公告)号:CN105185386B

    公开(公告)日:2018-08-24

    申请号:CN201510629748.2

    申请日:2015-09-28

    Abstract: 本发明公开了一种基于两步排列熵的语音活动检测方法,其特征是,具体包括如下步骤:(1)对语音信号进行分帧处理,得到各帧语音信号;(2)计算各帧语音信号的短时能量;(3)各帧语音信号进行第一步排列熵计算;(4)通过短时能量和排列熵,作第一步判断,检测噪声和语音信号;(5)对检测出的语音信号进行第二步排列熵计算;(6)判断语音信号的清浊音。本发明所达到的有益效果:充分利用了语音信号帧数之间的准周期性,利用排列熵作为语音信号复杂度的度量标准,实现语音活动检测的目的。

    基于一对多码书映射的语音转换方法

    公开(公告)号:CN103886859B

    公开(公告)日:2016-08-17

    申请号:CN201410050758.6

    申请日:2014-02-14

    Abstract: 本发明公开了一种基于一对多码书映射的语音转换方法,对源语音码书与目标语音码书的一对多映射关系的建立,从平行数据库中随机提取一部分语音,对齐并提取声道参数后快速建立源与目标语音码书;估算用于训练的数据中源与目标特征参数对应于其各自码书的权重,通过统计与分析二者的关系来建立源与目标语音的权重映射关系,进而掌握个性特征的映射规则,实现高质量、快速的语音转换,能够解决实际环境中语音转换系统的实时性、转换后相似度的问题,最终在对语音转换实时性追求的过程中减小转换效果的代价,从而提高转换结果与目标语音的相似度,具有良好的应用前景。

    训练数据匮乏下的鲁棒性语音转换方法

    公开(公告)号:CN102968988B

    公开(公告)日:2015-09-16

    申请号:CN201210488131.X

    申请日:2012-11-27

    Inventor: 徐宁 沈媛 鲍静益

    Abstract: 本发明公开了一种训练数据匮乏下的鲁棒性语音转换方法,利用经验模式分解算法分析平行参数序列,挖掘源与目标个性特征相关的表征信息,并结合高斯过程模型设计并训练转换函数,压缩冗余信息,提高数据匮乏条件下的系统鲁棒性。本发明提供的训练数据匮乏下的鲁棒性语音转换方法,将高斯过程建模和经验模式分解的参数特征化方法应用在语音转换模型中,可以描述和刻画局部数据中体现的共性特征,提高转换算法在训练数据匮乏条件下的泛化性;同时,该方法进一步强化特征模式之间的区分度,提高转换算法在训练数据匮乏情况下的精确度。

    基于信号时序特征建模的高质量语音转换方法

    公开(公告)号:CN103035236A

    公开(公告)日:2013-04-10

    申请号:CN201210490464.6

    申请日:2012-11-27

    Abstract: 本发明公开了一种基于信号时序特征建模的高质量语音转换方法,针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果。本发明提供的基于信号时序特征的高质量语音转换方法,充分利用了语音信号参数间的强烈相关性,通过模拟参数随时间变化的物理过程,构造了一种新型的混合式卡尔曼滤波器,并将其用于语音转换的参数映射过程,设计了一套特殊的、将卡尔曼滤波器参数与语音信号物理属性相关联的转换算法,实现说话人个性特征的变换。

    基于高斯过程输出后滤波的语音转换方法

    公开(公告)号:CN106782599A

    公开(公告)日:2017-05-31

    申请号:CN201611189592.1

    申请日:2016-12-21

    CPC classification number: G10L25/03 G10L25/27

    Abstract: 本发明公开一种基于高斯过程输出后滤波的语音转换方法,首先进行训练阶段,针对源和目标的平行数据,利用高斯过程建立源与目标之间的映射关系,然后在转换阶段,通过该映射关系得到目标预测特征参数,利用高斯过程对该输出值进行最大似然估计,并建立输出值的方差的高斯分布。再对最大似然估计和方差的高斯分布进行联合最优化,完成对高斯过程输出的后滤波得到目标参数值,实现高质量的语音转换效果。本发明充分考虑了语音信号特征参数过平滑的问题,构造高斯过程输出后滤波的联合优化函数,提高预测特征参数的准确性,实现说话人个性特征的高质量变换。

    基于一对多码书映射的语音转换方法

    公开(公告)号:CN103886859A

    公开(公告)日:2014-06-25

    申请号:CN201410050758.6

    申请日:2014-02-14

    Abstract: 本发明公开了一种基于一对多码书映射的语音转换方法,对源语音码书与目标语音码书的一对多映射关系的建立,从平行数据库中随机提取一部分语音,对齐并提取声道参数后快速建立源与目标语音码书;估算用于训练的数据中源与目标特征参数对应于其各自码书的权重,通过统计与分析二者的关系来建立源与目标语音的权重映射关系,进而掌握个性特征的映射规则,实现高质量、快速的语音转换,能够解决实际环境中语音转换系统的实时性、转换后相似度的问题,最终在对语音转换实时性追求的过程中减小转换效果的代价,从而提高转换结果与目标语音的相似度,具有良好的应用前景。

    训练数据匮乏下的鲁棒性语音转换方法

    公开(公告)号:CN102968988A

    公开(公告)日:2013-03-13

    申请号:CN201210488131.X

    申请日:2012-11-27

    Inventor: 徐宁 沈媛 鲍静益

    Abstract: 本发明公开了一种训练数据匮乏下的鲁棒性语音转换方法,利用经验模式分解算法分析平行参数序列,挖掘源与目标个性特征相关的表征信息,并结合高斯过程模型设计并训练转换函数,压缩冗余信息,提高数据匮乏条件下的系统鲁棒性。本发明提供的训练数据匮乏下的鲁棒性语音转换方法,将高斯过程建模和经验模式分解的参数特征化方法应用在语音转换模型中,可以描述和刻画局部数据中体现的共性特征,提高转换算法在训练数据匮乏条件下的泛化性;同时,该方法进一步强化特征模式之间的区分度,提高转换算法在训练数据匮乏情况下的精确度。

    基于两步排列熵的语音活动检测方法

    公开(公告)号:CN105185386A

    公开(公告)日:2015-12-23

    申请号:CN201510629748.2

    申请日:2015-09-28

    Abstract: 本发明公开了一种基于两步排列熵的语音活动检测方法,其特征是,具体包括如下步骤:(1)对语音信号进行分帧处理,得到各帧语音信号;(2)计算各帧语音信号的短时能量;(3)各帧语音信号进行第一步排列熵计算;(4)通过短时能量和排列熵,作第一步判断,检测噪声和语音信号;(5)对检测出的语音信号进行第二步排列熵计算;(6)判断语音信号的清浊音。本发明所达到的有益效果:充分利用了语音信号帧数之间的准周期性,利用排列熵作为语音信号复杂度的度量标准,实现语音活动检测的目的。

    基于信号时序特征建模的高质量语音转换方法

    公开(公告)号:CN103035236B

    公开(公告)日:2014-12-17

    申请号:CN201210490464.6

    申请日:2012-11-27

    Abstract: 本发明公开了一种基于信号时序特征建模的高质量语音转换方法,针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果。本发明提供的基于信号时序特征的高质量语音转换方法,充分利用了语音信号参数间的强烈相关性,通过模拟参数随时间变化的物理过程,构造了一种新型的混合式卡尔曼滤波器,并将其用于语音转换的参数映射过程,设计了一套特殊的、将卡尔曼滤波器参数与语音信号物理属性相关联的转换算法,实现说话人个性特征的变换。

Patent Agency Ranking