测量语速的方法和装置以及录音设备

    公开(公告)号:CN1841496A

    公开(公告)日:2006-10-04

    申请号:CN200510059832.1

    申请日:2005-03-31

    Abstract: 本发明提供了测量语速的方法、测量语速的装置和录音设备。本发明的测量语速的方法,包括:输入记录有语音的语音信息;从上述语音信息中识别音素序列和每个音素对应的时间分割点;根据上述识别出的音素序列和每个音素对应的时间分割点,识别字序列和每个字对应的时间分割点;以及根据上述识别出的字序列和每个字相应的时间分割点,计算上述语音的语速。采用本实施例的测量语速的方法,可以自动地测量出一段语音的语速,而不需要在录音后期由人工测量语速。

    韵律自适应及语音合成的方法和装置

    公开(公告)号:CN101452699A

    公开(公告)日:2009-06-10

    申请号:CN200710197104.6

    申请日:2007-12-04

    CPC classification number: G10L13/08

    Abstract: 本发明提供数据驱动训练差分韵律自适应模型、生成差分韵律自适应模型、韵律预测和语音合成的方法及装置。该数据驱动训练差分韵律自适应模型的方法包括:用时长和基频的正交多项式的系数表示差分韵律向量;对于差分韵律向量中的每一个参数,利用与差分韵律预测相关的多个属性和这些属性的组合生成初始参数预测模型,其中每个属性或上述属性的组合被作为一项;计算参数预测模型的每一项的重要性;删除所计算的重要性最低的项;利用剩余的项重新生成参数预测模型;判断重新生成的参数预测模型是否最优;如果参数预测模型不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中差分韵律向量及其全部参数预测模型构成差分韵律自适应模型。

    字音转换预测以及语音合成的方法和装置

    公开(公告)号:CN101271687B

    公开(公告)日:2012-07-18

    申请号:CN200710089176.9

    申请日:2007-03-20

    Inventor: 易立夫 郝杰

    Abstract: 本发明提供了数据驱动训练字音转换概率预测模型、构建字音转换概率预测模型、字音转换预测以及语音合成的方法和装置。本发明的数据驱动训练字音转换概率预测模型的方法包括:利用与字音转换预测相关的多个属性和至少一部分上述属性的组合生成初始字音转换概率预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述字音转换概率预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成字音转换概率预测模型;判断上述重新生成的字音转换概率预测模型是否最优;以及如果上述字音转换概率预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。

    训练时长预测模型、时长预测和语音合成的方法及装置

    公开(公告)号:CN1953052B

    公开(公告)日:2010-09-08

    申请号:CN200510114320.0

    申请日:2005-10-20

    Inventor: 易立夫 郝杰

    CPC classification number: G10L13/10 G10L15/148

    Abstract: 本发明提供了数据驱动训练时长预测模型的方法和装置、时长预测方法和装置以及语音合成方法和装置。本发明的数据驱动训练时长预测模型的方法,包括:利用与时长预测相关的多个属性和至少一部分上述属性的组合生成初始时长预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述时长预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成时长预测模型;判断上述重新生成的时长预测模型是否最优;以及如果上述时长预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。

    字音转换预测以及语音合成的方法和装置

    公开(公告)号:CN101271687A

    公开(公告)日:2008-09-24

    申请号:CN200710089176.9

    申请日:2007-03-20

    Inventor: 易立夫 郝杰

    Abstract: 本发明提供了数据驱动训练字音转换概率预测模型、构建字音转换概率预测模型、字音转换预测以及语音合成的方法和装置。本发明的数据驱动训练字音转换概率预测模型的方法包括:利用与字音转换预测相关的多个属性和至少一部分上述属性的组合生成初始字音转换概率预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述字音转换概率预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成字音转换概率预测模型;判断上述重新生成的字音转换概率预测模型是否最优;以及如果上述字音转换概率预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。

    基频和停顿预测及语音合成的方法和装置

    公开(公告)号:CN101051459A

    公开(公告)日:2007-10-10

    申请号:CN200610073145.X

    申请日:2006-04-06

    Inventor: 易立夫 郝杰

    CPC classification number: G10L13/10

    Abstract: 本发明提供了数据驱动训练基频和停顿预测模型、基频和停顿预测以及语音合成方法和装置。本发明的数据驱动训练基频预测模型的方法包括:用正交多项式表示基频;对于上述正交多项式的每一个参数,利用与基频预测相关的多个属性和至少一部分上述属性的组合生成一个初始参数预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述参数预测模型的每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成参数预测模型;判断上述重新生成的参数预测模型是否最优;以及如果上述参数预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中,上述正交多项式及其全部参数预测模型构成基频预测模型。

    训练时长预测模型、时长预测和语音合成的方法及装置

    公开(公告)号:CN1953052A

    公开(公告)日:2007-04-25

    申请号:CN200510114320.0

    申请日:2005-10-20

    Inventor: 易立夫 郝杰

    CPC classification number: G10L13/10 G10L15/148

    Abstract: 本发明提供了数据驱动训练时长预测模型的方法和装置、时长预测方法和装置以及语音合成方法和装置。本发明的数据驱动训练时长预测模型的方法,包括:利用与时长预测相关的多个属性和至少一部分上述属性的组合生成初始时长预测模型,其中每个上述属性或上述属性的组合被作为一项;计算上述时长预测模型中每一上述项的重要性;删除上述计算出的重要性最低的项;利用剩余的项重新生成时长预测模型;判断上述重新生成的时长预测模型是否最优;以及如果上述时长预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤。

Patent Agency Ranking