-
公开(公告)号:CN102385858B
公开(公告)日:2013-06-05
申请号:CN201010271135.3
申请日:2010-08-31
Applicant: 国际商业机器公司
IPC: G10L13/02
Abstract: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。
-
公开(公告)号:CN102017513B
公开(公告)日:2013-05-22
申请号:CN200980115671.X
申请日:2009-03-10
Applicant: 国际商业机器公司
IPC: H04L9/32
CPC classification number: G06F17/289 , H04L63/0442 , H04L63/104
Abstract: 一种用于实时网络通信的系统及方法,提供会话标识符(会话ID)作为用于在客户端之间的群组通信(20,22)的公开密钥,并且提供表示多个客户端(12)中的每一个的私有密钥的频道标识符(频道ID)。该频道标识符包括客户端特定属性,该属性用以指示该群组通信的分组准则。基于该公开密钥及私有密钥组合经由网络建立介于客户端(12)与服务(14)之间的动态通信链路,以使得基于该私有密钥及该公开密钥的该属性而实现群组通信。通过使用翻译服务(16)来翻译通信,该翻译服务(16)使用与该私有密钥及该公开密钥的组合相关联的该属性而以指定语言提供响应信息以实现多语种实时通信。
-
公开(公告)号:CN104424955B
公开(公告)日:2018-11-27
申请号:CN201310385132.6
申请日:2013-08-29
Applicant: 国际商业机器公司
Abstract: 公开了一种生成音频内容的图形化表示的方法和设备。所述方法包括:获取有关音频内容中要图形化表示的对象的元数据;分析元数据以确定要图形化表示的对象之间的关联关系;从图形化表示元素的集合中选择分别与感兴趣的要图形化表示的对象以及关联关系对应的图形化表示元素;基于所选择的图形化表示元素,生成所述音频内容的图形化表示。通过所述方法和设备,用户能够快速了解音频的具体内容。还公开了在音频内容库中搜索音频内容的方法和设备,通过该方法和设备,用户能够了解特定话题的谈论历史,跟踪话题的演进。
-
公开(公告)号:CN103853749B
公开(公告)日:2017-04-26
申请号:CN201210505562.2
申请日:2012-11-30
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 本发明提供了一种基于模式的音频检索方法和系统。所述音频检索方法包括:基于模式对多个源音频数据进行标记,以获取各源音频数据的音频标记序列;获取目标音频数据的音频标记序列;基于目标音频数据的音频标记序列和各源音频数据的音频标记序列,根据预定匹配规则确定目标音频数据与源音频数据之间的匹配度;以及输出匹配度高于预定匹配度阈值的源音频数据,作为检索结果。利用本发明的方法和系统,能够无需人工参与标记而自动基于背景模式迭代地进行音频类标记和检索,从而提供更准确合理的音频检索结果。
-
公开(公告)号:CN104217149A
公开(公告)日:2014-12-17
申请号:CN201310210886.8
申请日:2013-05-31
Applicant: 国际商业机器公司
IPC: G06F21/32
Abstract: 本发明公开了一种用户认证的方法和设备。所述方法包括:向所述用户发送问题提示,所述问题提示要求用户说出语音片段以及动态问题的答案,所述语音片段具有相应的在认证之前训练出的文本相关的说话人识别模型;响应于接收所述语音回答,从述语音回答中切分出所述语音片段部分以及动态问题答案部分;验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。通过所述方法和设备,可以更为有效的防止用户认证时的录音欺诈。
-
公开(公告)号:CN102017513A
公开(公告)日:2011-04-13
申请号:CN200980115671.X
申请日:2009-03-10
Applicant: 国际商业机器公司
IPC: H04L9/32
CPC classification number: G06F17/289 , H04L63/0442 , H04L63/104
Abstract: 一种用于实时网络通信的系统及方法,提供会话标识符(会话ID)作为用于在客户端之间的群组通信(20,22)的公开密钥,并且提供表示多个客户端(12)中的每一个的私有密钥的频道标识符(频道ID)。该频道标识符包括客户端特定属性,该属性用以指示该群组通信的分组准则。基于该公开密钥及私有密钥组合经由网络建立介于客户端(12)与服务(14)之间的动态通信链路,以使得基于该私有密钥及该公开密钥的该属性而实现群组通信。通过使用翻译服务(16)来翻译通信,该翻译服务(16)使用与该私有密钥及该公开密钥的组合相关联的该属性而以指定语言提供响应信息以实现多语种实时通信。
-
公开(公告)号:CN104077077A
公开(公告)日:2014-10-01
申请号:CN201310106283.3
申请日:2013-03-29
Applicant: 国际商业机器公司
IPC: G06F3/0489 , G06F3/023 , G06F17/30
CPC classification number: G06F3/0482 , G06F3/018 , G06F3/0236 , G06F3/0237 , G06F17/30861
Abstract: 本发明涉及输入法,其公开了一种调整输入法中的信息提示的方法和装置,该方法包括:获取响应于用户在输入框中输入字符而显示的提示信息;根据所述提示信息调整输入法提示栏中后续提示字符的顺序。根据本发明实施例的调整输入法中的信息提示的方法能够根据提示栏的提示信息实时调整输入法提示栏中提示字符的顺序,便利用户选择。
-
公开(公告)号:CN102385858A
公开(公告)日:2012-03-21
申请号:CN201010271135.3
申请日:2010-08-31
Applicant: 国际商业机器公司
Abstract: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。
-
-
-
-
-
-
-