-
公开(公告)号:CN101546587A
公开(公告)日:2009-09-30
申请号:CN200810087922.5
申请日:2008-03-25
Applicant: 国际商业机器公司
Abstract: 本发明提供了在播放歌曲时自动显示视觉元素的方法和装置。根据本发明的一个方面,提供了一种在播放歌曲时自动显示视觉元素的方法,包括以下步骤:获取上述歌曲的歌词;获取上述歌曲的主题;利用视觉元素库,对上述歌词进行分析,以针对各句歌词获取与上述歌曲的主题相关的关键词,其中上述视觉元素库中的每个视觉元素都具有相关的主题和关键词;以及根据上述获取的歌曲的主题和各句歌词的关键词,在上述视觉元素库中选择合适的视觉元素进行显示。本发明的在播放歌曲时自动显示视觉元素的方法和装置可以将视觉效果按照歌曲的主题进行划分,从而可以根据播放歌曲的内容和意境,形成风格一致、主题统一的视觉效果展示给播放者。
-
公开(公告)号:CN101359473A
公开(公告)日:2009-02-04
申请号:CN200710139735.2
申请日:2007-07-30
Applicant: 国际商业机器公司
CPC classification number: G10L13/08 , G10L13/033 , G10L2021/0135
Abstract: 本发明提出了一种能够显著改进音色转换的质量,并保证转换的声音相似度的方法和装置。本发明在语音合成库中设置有若干标准说话人,根据不同的角色,本发明选用不同的标准说话人的声音进行语音合成,所述被选中的标准说话人的声音与原始角色之间已经存在一定程度的相似性。然后本发明将这种与原始声音具有一定程度相似性的标准语音进一步进行音色转换,以精确模仿原始说话人的声音,从而使得转换后的声音在保证相似度的同时,更加接近原始的语音特征。
-
公开(公告)号:CN101242452B
公开(公告)日:2013-01-23
申请号:CN200710007010.8
申请日:2007-02-05
Applicant: 国际商业机器公司
CPC classification number: H04M3/4936 , H04M3/42221 , H04M3/5166 , H04M2203/2011
Abstract: 本发明提出了一种用于自动生成声音文档的方法和系统以及用于提供声音文档的方法和系统。所述自动生成声音文档的方法包括以下步骤:一实时交互式语音应答系统根据信息表单向用户发送提问信息,其中所述信息表单包括分类选择信息槽和至少一个录音片断信息槽;通过所述分类选择信息槽接收用户的分类选择信息,以及通过所述至少一个录音片断信息槽接收用户的录音片断;以及对以上所接收到的信息进行组合而生成声音文档。所述提供声音文档的方法通过信息索取方式或信息派发方式来实现。
-
公开(公告)号:CN102385858A
公开(公告)日:2012-03-21
申请号:CN201010271135.3
申请日:2010-08-31
Applicant: 国际商业机器公司
Abstract: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。
-
公开(公告)号:CN101727904A
公开(公告)日:2010-06-09
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN101996631B
公开(公告)日:2014-12-03
申请号:CN200910168621.X
申请日:2009-08-28
Applicant: 国际商业机器公司
CPC classification number: G06F17/2827
Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括:获取目标文本和参考文本;以及基于音素相似度,在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法,以及用于自动检索多媒体资源的方法。
-
公开(公告)号:CN101727904B
公开(公告)日:2013-04-24
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN102237081A
公开(公告)日:2011-11-09
申请号:CN201010163229.9
申请日:2010-04-30
Applicant: 国际商业机器公司
CPC classification number: G10L25/48
Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括:接收输入语音数据;获取韵律约束条件;按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及提供所述评估的结果。所述系统包括:输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制,也就是说用户可以根据特定文字/语音进行朗读或者跟读,也可以自由发挥。
-
公开(公告)号:CN101996631A
公开(公告)日:2011-03-30
申请号:CN200910168621.X
申请日:2009-08-28
Applicant: 国际商业机器公司
CPC classification number: G06F17/2827
Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括:获取目标文本和参考文本;以及基于音素相似度,在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法,以及用于自动检索多媒体资源的方法。
-
公开(公告)号:CN101242452A
公开(公告)日:2008-08-13
申请号:CN200710007010.8
申请日:2007-02-05
Applicant: 国际商业机器公司
CPC classification number: H04M3/4936 , H04M3/42221 , H04M3/5166 , H04M2203/2011
Abstract: 本发明提出了一种用于自动生成声音文档的方法和系统以及用于提供声音文档的方法和系统。所述自动生成声音文档的方法包括以下步骤:一实时交互式语音应答系统根据信息表单向用户发送提问信息,其中所述信息表单包括分类选择信息槽和至少一个录音片断信息槽;通过所述分类选择信息槽接收用户的分类选择信息,以及通过所述至少一个录音片断信息槽接收用户的录音片断;以及对以上所接收到的信息进行组合而生成声音文档。所述提供声音文档的方法通过信息索取方式或信息派发方式来实现。
-
-
-
-
-
-
-
-
-