基于语音分析与合成的高品质实时变声方法

    公开(公告)号:CN100440314C

    公开(公告)日:2008-12-03

    申请号:CN200410062337.1

    申请日:2004-07-06

    Inventor: 孟猛 张树武

    Abstract: 本发明涉及语音变换技术领域的一种基于语音分析与合成的高品质实时变声方法。在时域上按照时间长度改变的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补偿时间长度调整对此二者的影响,最后恢复时域信号。通过快速傅立叶变换将时域信号转化到频域上,将话音的基频和共振峰位置进行分离,并分别调整,然后重新合成语音,从而调节音长、音高和音色,改变音强,实现嗓音变换。本发明可以实时对语音进行处理,可直接应用于网络电话、语音聊天室等休闲领域,也可用于配音、音乐合成等实用领域。同时,该方法也可以应用语音合成方面,起到改善合成语音整体音质的作用。

    一种用于鲁棒语音识别的语音特征提取方法

    公开(公告)号:CN102982801B

    公开(公告)日:2014-12-10

    申请号:CN201210449436.X

    申请日:2012-11-12

    Abstract: 本发明公开了一种用于鲁棒语音识别的语音特征提取方法,该方法包括:获取功率谱;采用滤波器组对功率谱进行处理;采用帧平均的方式求取中等时长的功率谱;对功率谱进行不对称滤波处理,同时对功率谱进行掩蔽处理,得到纯净语音功率谱;对纯净语音和带噪语音功率谱的比值进行通道平均处理,以进行平滑;将平滑后的纯净语音和带噪语音的功率谱比值同滤波器组输出的功率谱相乘,得到纯净语音的短时功率谱;对短时功率谱进行能量归一化处理,以消除乘性噪声;功率谱进行等响度加重;功率谱进行指数操作;对功率谱进行傅立叶逆变换;求取信号的倒谱系数;对倒谱系数进行均值归一化处理。本发明提取的语音信号的特征,速度快,能够实现在线处理;利用本发明提取的特征训练出的声学模型,具用很好的抗噪效果;本发明具有非常重大的使用意义。

    一种用于鲁棒语音识别的语音特征提取方法

    公开(公告)号:CN102982801A

    公开(公告)日:2013-03-20

    申请号:CN201210449436.X

    申请日:2012-11-12

    Abstract: 本发明公开了一种用于鲁棒语音识别的语音特征提取方法,该方法包括:获取功率谱;采用滤波器组对功率谱进行处理;采用帧平均的方式求取中等时长的功率谱;对功率谱进行不对称滤波处理,同时对功率谱进行掩蔽处理,得到纯净语音功率谱;对纯净语音和带噪语音功率谱的比值进行通道平均处理,以进行平滑;将平滑后的纯净语音和带噪语音的功率谱比值同滤波器组输出的功率谱相乘,得到纯净语音的短时功率谱;对短时功率谱进行能量归一化处理,以消除乘性噪声;功率谱进行等响度加重;功率谱进行指数操作;对功率谱进行傅立叶逆变换;求取信号的倒谱系数;对倒谱系数进行均值归一化处理。本发明提取的语音信号的特征,速度快,能够实现在线处理;利用本发明提取的特征训练出的声学模型,具用很好的抗噪效果;本发明具有非常重大的使用意义。

    长语音连续识别及识别结果实时反馈方法和系统

    公开(公告)号:CN103035243A

    公开(公告)日:2013-04-10

    申请号:CN201210551379.6

    申请日:2012-12-18

    Inventor: 徐波 孟猛 高鹏

    Abstract: 本发明公开了一种长语音连续识别及语音识别结果实时反馈的方法及系统。该方法包括:在识别网络中增加句尾结束点到识别起始点的扩展可能性;解码过程中,识别路径在扩展时既可以生成单一句子,也可以生成多个连续句子,通过声学和语言概率的整体寻优来分割大篇幅语音信号;定期对所有活跃节点的最优历史路径的共有部分进行检测;获得当前时刻已经固定下来的识别单词序列;将更新的局部识别结果实时反馈给用户;回收已经确定下来的识别部分对应的解码空间。利用本发明,不依赖于端点检测算法,即可实现长语音信号的连续、可持续识别,同时给用户更好的人机交互体验。

    基于语音分析与合成的高品质实时变声方法

    公开(公告)号:CN1719514A

    公开(公告)日:2006-01-11

    申请号:CN200410062337.1

    申请日:2004-07-06

    Inventor: 孟猛 张树武

    Abstract: 本发明涉及语音变换技术领域的一种基于语音分析与合成的高品质实时变声方法。在时域上按照时间长度改变的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补偿时间长度调整对此二者的影响,最后恢复时域信号。通过快速傅立叶变换将时域信号转化到频域上,将话音的基频和共振峰位置进行分离,并分别调整,然后重新合成语音,从而调节音长、音高和音色,改变音强,实现嗓音变换。本发明可以实时对语音进行处理,可直接应用于网络电话、语音聊天室等休闲领域,也可用于配音、音乐合成等实用领域。同时,该方法也可以应用语音合成方面,起到改善合成语音整体音质的作用。

    长语音连续识别及识别结果实时反馈方法和系统

    公开(公告)号:CN103035243B

    公开(公告)日:2014-12-24

    申请号:CN201210551379.6

    申请日:2012-12-18

    Inventor: 徐波 孟猛 高鹏

    Abstract: 本发明公开了一种长语音连续识别及语音识别结果实时反馈的方法及系统。该方法包括:在识别网络中增加句尾结束点到识别起始点的扩展可能性;解码过程中,识别路径在扩展时既可以生成单一句子,也可以生成多个连续句子,通过声学和语言概率的整体寻优来分割大篇幅语音信号;定期对所有活跃节点的最优历史路径的共有部分进行检测;获得当前时刻已经固定下来的识别单词序列;将更新的局部识别结果实时反馈给用户;回收已经确定下来的识别部分对应的解码空间。利用本发明,不依赖于端点检测算法,即可实现长语音信号的连续、可持续识别,同时给用户更好的人机交互体验。

Patent Agency Ranking