-
公开(公告)号:CN104731842B
公开(公告)日:2018-06-05
申请号:CN201410677474.X
申请日:2014-11-21
Applicant: 国际商业机器公司
CPC classification number: G06F17/30598 , G06F17/30528 , G06F17/30867 , G06F17/30914 , G06F17/30917 , G06Q10/10 , G06Q50/01 , H04L51/046 , H04L65/1069
Abstract: 公开涉及用于使用电子通信数据来映射关系的方法和系统。成对关系数据集具有多个属性(诸如谁、什么、何时、何处、如何)且具有什么属性(也称为话题属性),该什么属性具有词语维度和人维度。所述什么属性中的所述话题维度中的数据涉及关于成对对的所述第一人和所述第二人之间的特定的人类个人关系的话题(包括其他人)。所述什么属性数据是通过处理基础数据而导出的,该基础数据包括交流数据(即,所述第一人和所述第二人参与的交流的主旨,包括即时通讯和电子邮件交换)。在聊天会话期间实时地向用户显示成对关系数据。
-
公开(公告)号:CN1889170A
公开(公告)日:2007-01-03
申请号:CN200510079778.7
申请日:2005-06-28
Applicant: 国际商业机器公司
CPC classification number: G10L13/04
Abstract: 本发明提供一种将录制的语音模板与TTS系统相结合生成高质量的合成语音的方法和系统。在本发明中:在包含预先录制的语音模板的数据库中搜索与希望合成语音的文本内容最匹配的语音模板;将最匹配的语音模板截成多个片断,生成与文本内容相同的保留片断以及与文本内容不同的差异片断;对与差异片断对应的文本内容部分进行语音合成;以及将合成的语音与最匹配的语音模板的保留片断进行拼接。采用本发明的方法和系统产生的合成语音继承了人说话的韵律结构,极大提高了合成语音的质量。此外,在本发明中,采用编辑距离算法搜索最匹配的语音模板,可以保证输出的最匹配模式具有最小的编辑操作次数,从而避免了很多接合点。
-
公开(公告)号:CN1156819C
公开(公告)日:2004-07-07
申请号:CN01116305.4
申请日:2001-04-06
Applicant: 国际商业机器公司
IPC: G10L13/00
CPC classification number: G10L13/033 , G10L2021/0135
Abstract: 本发明公开了一种由文本生成个性化语音方法,包括以下步骤:对输入的文本进行分析,通过标准TTS数据库得出可以表征将要合成的语音的特征的标准语音参数;使用通过训练获得的参数个性化模型将所述标准语音参数变换为个性化的语音参数;以及基于所述个性化语音参数合成对应于所述输入文本的语音。本发明的由文本生成个性化语音的方法,可以模仿任意的目标人的语音,从而使标准TTS系统产生的语音更加生动,并且具有个性化特征。
-
公开(公告)号:CN100524457C
公开(公告)日:2009-08-05
申请号:CN200410046117.X
申请日:2004-05-31
Applicant: 国际商业机器公司
Abstract: 本发明提供了一种文本至语音的转换方法和装置,以及一种调整文本至语音转换语料库的方法和装置。其中,文本至语音的转换方法包括文本分析步骤,用于基于由第一语料库产生的文本至语音转换模型,对所述文本进行分析以获得文本的描述性韵律注解信息;韵律参数预测步骤,用于基于上述文本分析步骤的结果对文本的韵律参数进行预测;语音合成步骤,用于基于所预测的文本的韵律参数合成所述文本的语音;其中所述文本的描述性韵律注解信息包括文本的韵律结构,所述方法还包括将所述文本的韵律结构根据合成语音的目标语音速度进行调整。本发明根据合成语音的目标语音速度调整文本的韵律结构,从而可以获得更好的合成语音质量。
-
公开(公告)号:CN1705016A
公开(公告)日:2005-12-07
申请号:CN200410046117.X
申请日:2004-05-31
Applicant: 国际商业机器公司
Abstract: 本发明提供了一种文本至语音的转换方法和装置,以及一种调整文本至语音转换语料库的方法和装置。其中,文本至语音的转换方法包括文本分析步骤,用于基于由第一语料库产生的文本至语音转换模型,对所述文本进行分析以获得文本的描述性韵律注解信息;韵律参数预测步骤,用于基于上述文本分析步骤的结果对文本的韵律参数进行预测;语音合成步骤,用于基于所预测的文本的韵律参数合成所述文本的语音;其中所述文本的描述性韵律注解信息包括文本的韵律结构,所述方法还包括将所述文本的韵律结构根据合成语音的目标语音速度进行调整。本发明根据合成语音的目标语音速度调整文本的韵律结构,从而可以获得更好的合成语音质量。
-
公开(公告)号:CN1159702C
公开(公告)日:2004-07-28
申请号:CN01116524.3
申请日:2001-04-11
Applicant: 国际商业机器公司
Abstract: 本发明公开了一种具有情感的语音-语音翻译系统和方法。本发明的系统包括:语音识别装置、机器翻译装置、文本-语音生成装置、情感表述参数检测装置以及情感表述参数映射装置,其中,情感表述参数检测装置用于从原始语音信号中提取情感表述参数,而情感表述参数映射装置,用于将所述情感表述参数从一种语言(方言)映射到另一种语言(方言),并将映射结果作用于文本-语音生成装置,使其产生可以传达情感的语音输出。
-
公开(公告)号:CN104731842A
公开(公告)日:2015-06-24
申请号:CN201410677474.X
申请日:2014-11-21
Applicant: 国际商业机器公司
CPC classification number: G06F17/30598 , G06F17/30528 , G06F17/30867 , G06F17/30914 , G06F17/30917 , G06Q10/10 , G06Q50/01 , H04L51/046 , H04L65/1069
Abstract: 公开涉及用于使用电子通信数据来映射关系的方法和系统。成对关系数据集具有多个属性(诸如谁、什么、何时、何处、如何)且具有什么属性(也称为话题属性),该什么属性具有词语维度和人维度。所述什么属性中的所述话题维度中的数据涉及关于成对对的所述第一人和所述第二人之间的特定的人类个人关系的话题(包括其他人)。所述什么属性数据是通过处理基础数据而导出的,该基础数据包括交流数据(即,所述第一人和所述第二人参与的交流的主旨,包括即时通讯和电子邮件交换)。在聊天会话期间实时地向用户显示成对关系数据。
-
公开(公告)号:CN1755796A
公开(公告)日:2006-04-05
申请号:CN200410085186.1
申请日:2004-09-30
Applicant: 国际商业机器公司
Abstract: 本发明提供一种在TTS系统中进行距离定义的方法。该方法将高斯混合模型GMM应用于TTS的距离定义中,以解决现有TTS技术中的诸如数据稀疏和数据分散这样的疑难问题。该方法在合成过程中包括如下步骤:为需要进行TTS语音合成的单元决定其类属,由此确定该类属的GMM模型;计算该类属中的各个待选样本与确定的GMM模型间的距离;取出具有最小距离的那个样本,以用于语音合成。
-
公开(公告)号:CN1379392A
公开(公告)日:2002-11-13
申请号:CN01116524.3
申请日:2001-04-11
Applicant: 国际商业机器公司
Abstract: 本发明公开了一种具有情感的语音-语音翻译系统和方法。本发明的系统包括:语音识别装置、机器翻译装置、文本-语音生成装置、情感表述参数检测装置以及情感表述参数映射装置,其中,情感表述参数检测装置用于从原始语音信号中提取情感表述参数,而情感表述参数映射装置,用于将所述情感表述参数从一种语言(方言)映射到另一种语言(方言),并将映射结果作用于文本-语音生成装置,使其产生可以传达情感的语音输出。
-
公开(公告)号:CN1379391A
公开(公告)日:2002-11-13
申请号:CN01116305.4
申请日:2001-04-06
Applicant: 国际商业机器公司
IPC: G10L13/00
CPC classification number: G10L13/033 , G10L2021/0135
Abstract: 本发明公开了一种由文本生成个性化语音方法,包括以下步骤:对输入的文本进行分析,通过标准TTS数据库得出可以表征将要合成的语音的特征的标准语音参数;使用通过训练获得的参数个性化模型将所述标准语音参数变换为个性化的语音参数;以及基于所述个性化语音参数合成对应于所述输入文本的语音。本发明的由文本生成个性化语音的方法,可以模仿任意的目标人的语音,从而使标准TTS系统产生的语音更加生动,并且具有个性化特征。
-
-
-
-
-
-
-
-
-