-
公开(公告)号:CN101046956A
公开(公告)日:2007-10-03
申请号:CN200610066503.4
申请日:2006-03-28
Applicant: 国际商业机器公司
CPC classification number: G10H1/0091 , G10H2240/145 , G10H2250/315 , G10L13/033
Abstract: 本发明提供了一种交互式音效产生方法,包括:为用户提供多个音效标识,其中每个所述音效标识对应于一特定音效对象,所述音效对象包括代表预先定义的声音文件的种子声音和代表对声音的操作的音效动作;针对整个源声音或者至少一段源声音,用户选择至少一个所述音效标识;利用所选择的音效标识对源声音进行编辑,形成音效表达式;解释上述音效表达式,以确定上述音效表达式中每个音效标识所对应的操作和该操作的执行顺序;以及按照上述顺序执行上述操作以输出具有音效的声音。本发明的方法使得用户可以实时、动态地对声音进行音效编辑,从而提供更具用户个性化的音效。另外,本发明还提供一种交互式音效产生系统。
-
公开(公告)号:CN101004911A
公开(公告)日:2007-07-25
申请号:CN200610001466.9
申请日:2006-01-17
Applicant: 国际商业机器公司
CPC classification number: G10L15/07 , G10L2021/0135
Abstract: 一种用于生成频率弯曲函数、和进行频率弯曲的方法及装置。该用于生成频率弯曲函数的方法包括:准备源说话者和目标说话者的训练语音;将所述训练语音进行帧对齐;从帧对齐的训练语音中选择对齐的帧;提取所选择的对齐的帧的相对应的共振峰参数组;以及根据相对应的共振峰参数组生成频率弯曲函数。该选择对齐的帧的步骤优选地选择已帧对齐的、源说话者和目标说话者的具有相同或相似上下文的相同或相似音素的中间的一对对齐的帧。所述生成弯曲函数的步骤优选地将相对应的共振峰参数组中的各对对应的共振峰参数作为分段线性频率弯曲函数中的关键点,以此来生成该频率弯曲函数。
-
公开(公告)号:CN1226717C
公开(公告)日:2005-11-09
申请号:CN00126471.0
申请日:2000-08-30
Applicant: 国际商业机器公司
IPC: G10L15/04
CPC classification number: G10L15/063 , G10L15/183
Abstract: 一种自动提取新词的方法和系统,包括步骤:对原始语料库进行分段,成为分段的语料库;将分段的语料库分割成子串并对子串在语料库中的出现次数进行统计;过滤掉假词,输出新词。该方法可以高效的从大量语料中自动提取新词。
-
公开(公告)号:CN1159702C
公开(公告)日:2004-07-28
申请号:CN01116524.3
申请日:2001-04-11
Applicant: 国际商业机器公司
Abstract: 本发明公开了一种具有情感的语音-语音翻译系统和方法。本发明的系统包括:语音识别装置、机器翻译装置、文本-语音生成装置、情感表述参数检测装置以及情感表述参数映射装置,其中,情感表述参数检测装置用于从原始语音信号中提取情感表述参数,而情感表述参数映射装置,用于将所述情感表述参数从一种语言(方言)映射到另一种语言(方言),并将映射结果作用于文本-语音生成装置,使其产生可以传达情感的语音输出。
-
公开(公告)号:CN1235312A
公开(公告)日:1999-11-17
申请号:CN98108367.6
申请日:1998-05-13
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G10L15/26
Abstract: 连续语音识别中的标点符号自动生成装置,包括用于识别用户语音并将所述用户语音转换为文字的装置(1,2,3,5),该用于识别用户语音的装置(1,2,3,5)还识别用户语音中的准噪声;还包括:用于标记装置(1,2,3,5)的输出结果中的准噪声的装置(9);用于根据含有准标点符号的语言模型,计算在装置(9)所标记的每个准噪声处最可能的准标点符号,产生与最可能的准标点符号相应的标点符号的装置(10,14,13)。
-
公开(公告)号:CN1212403A
公开(公告)日:1999-03-31
申请号:CN97119643.5
申请日:1997-09-19
Applicant: 国际商业机器公司
IPC: G06F17/20
CPC classification number: G10L15/193
Abstract: 一种可以识别孤立、非相关汉字的语音识别方法和系统。所述方法使用各种类型的汉字描述语言来描述要输入的孤立、非相关汉字,而所述的语音识别系统使用基于汉字描述语言(CDL)的识别器接收人们通过语音输入的各种类型汉字描述语言,在运用CDL语法分析器对其进行分析的基础上由汉字发生器根据分析结果产生相应的汉字。这样,在脱离上下文环境的情况下,也可以可靠地识别出孤立、非相关的汉字。
-
公开(公告)号:CN1940915B
公开(公告)日:2010-05-05
申请号:CN200510108065.9
申请日:2005-09-29
Applicant: 国际商业机器公司
CPC classification number: G06F17/2715 , G06F17/30731
Abstract: 本发明提供一种通过扩充新的样本种子来自动扩充训练语料的系统和方法。其中使用样本种子收集训练语料;基于已有的样本种子和被收集的训练语料,产生新的样本种子;基于收集训练语料时所使用过的所有样本种子和新的样本种子确定训练语料扩充策略;按照训练语料扩充策略调整新的样本种子,使用调整后的新的样本种子再次收集训练语料,重复上述步骤直到达到预定的条件。本发明能够以较低的成本方便地从网络或者其它资源中自动扩充训练语料,提高训练语料的覆盖面。
-
公开(公告)号:CN1889170A
公开(公告)日:2007-01-03
申请号:CN200510079778.7
申请日:2005-06-28
Applicant: 国际商业机器公司
CPC classification number: G10L13/04
Abstract: 本发明提供一种将录制的语音模板与TTS系统相结合生成高质量的合成语音的方法和系统。在本发明中:在包含预先录制的语音模板的数据库中搜索与希望合成语音的文本内容最匹配的语音模板;将最匹配的语音模板截成多个片断,生成与文本内容相同的保留片断以及与文本内容不同的差异片断;对与差异片断对应的文本内容部分进行语音合成;以及将合成的语音与最匹配的语音模板的保留片断进行拼接。采用本发明的方法和系统产生的合成语音继承了人说话的韵律结构,极大提高了合成语音的质量。此外,在本发明中,采用编辑距离算法搜索最匹配的语音模板,可以保证输出的最匹配模式具有最小的编辑操作次数,从而避免了很多接合点。
-
公开(公告)号:CN1159662C
公开(公告)日:2004-07-28
申请号:CN98108367.6
申请日:1998-05-13
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G10L15/26
Abstract: 连续语音识别中的标点符号自动生成装置,包括用于识别用户语音并将所述用户语音转换为文字的装置(1,2,3,5),该用于识别用户语音的装置(1,2,3,5)还识别用户语音中的准噪声;还包括:用于标记装置(1,2,3,5)的输出结果中的准噪声的装置(9);用于根据含有准标点符号的语言模型,计算在装置(9)所标记的每个准噪声处最可能的准标点符号,产生与最可能的准标点符号相应的标点符号的装置(10,14,13)。
-
公开(公告)号:CN1156819C
公开(公告)日:2004-07-07
申请号:CN01116305.4
申请日:2001-04-06
Applicant: 国际商业机器公司
IPC: G10L13/00
CPC classification number: G10L13/033 , G10L2021/0135
Abstract: 本发明公开了一种由文本生成个性化语音方法,包括以下步骤:对输入的文本进行分析,通过标准TTS数据库得出可以表征将要合成的语音的特征的标准语音参数;使用通过训练获得的参数个性化模型将所述标准语音参数变换为个性化的语音参数;以及基于所述个性化语音参数合成对应于所述输入文本的语音。本发明的由文本生成个性化语音的方法,可以模仿任意的目标人的语音,从而使标准TTS系统产生的语音更加生动,并且具有个性化特征。
-
-
-
-
-
-
-
-
-