语音韵律评估方法与系统

    公开(公告)号:CN102237081B

    公开(公告)日:2013-04-24

    申请号:CN201010163229.9

    申请日:2010-04-30

    CPC classification number: G10L25/48

    Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括:接收输入语音数据;获取韵律约束条件;按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及提供所述评估的结果。所述系统包括:输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制,也就是说用户可以根据特定文字/语音进行朗读或者跟读,也可以自由发挥。

    语音合成的方法和系统

    公开(公告)号:CN101593516B

    公开(公告)日:2011-08-24

    申请号:CN200810098474.9

    申请日:2008-05-28

    CPC classification number: G10L13/04 G10L13/08 G10L15/30

    Abstract: 本发明提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括:基于客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成;响应于判断需要更新客户端语料库的当前语料单元集合:分析文本内容,并生成具有相应语境特征的目标单元的列表,基于比客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总,根据语境特征为每个目标单元选择多个候选语料单元,根据多个候选单元为文本内容确定可用于语音合成的语料单元;以及基于所确定的语料单元,更新客户端语料库的当前语料单元集合。本发明还提供相应的系统。根据本发明的技术方案,客户端的TTS系统能够随着用户对该系统的进一步使用自适应的更新语料库,从而获得语音合成质量的有效改善。

    语音合成的方法和系统

    公开(公告)号:CN101593516A

    公开(公告)日:2009-12-02

    申请号:CN200810098474.9

    申请日:2008-05-28

    CPC classification number: G10L13/04 G10L13/08 G10L15/30

    Abstract: 本发明提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括:基于客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成;响应于判断需要更新客户端语料库的当前语料单元集合:分析文本内容,并生成具有相应语境特征的目标单元的列表,基于比客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总,根据语境特征为每个目标单元选择多个候选语料单元,根据多个候选单元为文本内容确定可用于语音合成的语料单元;以及基于所确定的语料单元,更新客户端语料库的当前语料单元集合。本发明还提供相应的系统。根据本发明的技术方案,客户端的TTS系统能够随着用户对该系统的进一步使用自适应的更新语料库,从而获得语音合成质量的有效改善。

    语音转换方法和系统
    14.
    发明公开

    公开(公告)号:CN101399044A

    公开(公告)日:2009-04-01

    申请号:CN200710163066.2

    申请日:2007-09-29

    CPC classification number: G10L21/00 G10L2021/0135

    Abstract: 本发明提供一种语音转换方法。该方法包括:语音分析步骤,用于对源说话者的语音执行语音分析以获得语音信息;频谱转换步骤,用于基于语音信息执行频谱转换,至少获得与目标说话者的语音相似的第一频谱;单元选择步骤,用于至少使用第一频谱作为目标,基于目标说话者的语音执行单元选择;频谱替换步骤,用于以所选择的目标说话者语音单元的频谱替代第一频谱的至少一部分;语音重建步骤,用于至少基于替换的频谱执行语音重建。本发明还提供相应的语音转换系统和计算机程序产品。本发明的语音转换方案将频率弯曲技术和TTS系统内的单元选择进行有机地结合,使得最终转换语音不仅具有与目标说话者语音的良好相似度,而且体现了人声的自然度。

    语音分析方法和装置以及语音合成方法和装置

    公开(公告)号:CN101281744A

    公开(公告)日:2008-10-08

    申请号:CN200710092294.5

    申请日:2007-04-04

    CPC classification number: G10L13/04 G10L25/48

    Abstract: 本发明公开了一种语音分析方法,该方法包括以下步骤:获取语音信号和相应的DEGG/EGG信号;将所述语音信号视为声源-滤波器模型中以所述DEGG/EGG信号为输入的声道滤波器的输出;以及由作为输出的所述语音信号和作为输入的所述DEGG/EGG信号估计所述声道滤波器的特征。其中所述声道滤波器特征由所述声道滤波器在选定时间点的状态向量表示,且所述估计步骤是使用卡尔曼滤波并优选地使用双向卡尔曼滤波完成的。

    情感语音合成方法和系统
    16.
    发明授权

    公开(公告)号:CN102385858B

    公开(公告)日:2013-06-05

    申请号:CN201010271135.3

    申请日:2010-08-31

    CPC classification number: G10L13/10 G10L13/02 G10L13/08

    Abstract: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。

    交互式音效产生方法及系统

    公开(公告)号:CN101046956A

    公开(公告)日:2007-10-03

    申请号:CN200610066503.4

    申请日:2006-03-28

    CPC classification number: G10H1/0091 G10H2240/145 G10H2250/315 G10L13/033

    Abstract: 本发明提供了一种交互式音效产生方法,包括:为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;针对整个源声音或者至少一段源声音,用户选择至少一个所述音效标识;利用所选择的音效标识对源声音进行编辑,形成音效表达式;解释上述音效表达式,以确定上述音效表达式中每个音效标识所对应的操作和该操作的执行顺序;以及按照上述顺序执行上述操作以输出具有音效的声音。本发明的方法使得用户可以实时、动态地对声音进行音效编辑,从而提供更具用户个性化的音效。另外,本发明还提供一种交互式音效产生系统。

    用于生成频率弯曲函数及进行频率弯曲的方法和装置

    公开(公告)号:CN101004911A

    公开(公告)日:2007-07-25

    申请号:CN200610001466.9

    申请日:2006-01-17

    CPC classification number: G10L15/07 G10L2021/0135

    Abstract: 一种用于生成频率弯曲函数、和进行频率弯曲的方法及装置。该用于生成频率弯曲函数的方法包括:准备源说话者和目标说话者的训练语音;将所述训练语音进行帧对齐;从帧对齐的训练语音中选择对齐的帧;提取所选择的对齐的帧的相对应的共振峰参数组;以及根据相对应的共振峰参数组生成频率弯曲函数。该选择对齐的帧的步骤优选地选择已帧对齐的、源说话者和目标说话者的具有相同或相似上下文的相同或相似音素的中间的一对对齐的帧。所述生成弯曲函数的步骤优选地将相对应的共振峰参数组中的各对对应的共振峰参数作为分段线性频率弯曲函数中的关键点,以此来生成该频率弯曲函数。

Patent Agency Ranking