-
公开(公告)号:CN103544140A
公开(公告)日:2014-01-29
申请号:CN201210241787.1
申请日:2012-07-12
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G06F17/27 , G06F17/2765 , G10L15/18 , G10L15/187 , G10L15/22
Abstract: 本发明属于语音识别领域,公开了一种数据处理方法,所述方法包括:获取展示内容对应的文本信息,所述展示内容包括多个区域;对所述文本信息进行文本分析,得到第一关键词序列,所述第一关键词序列包括与所述多个区域中至少一个区域关联的区域关键词;获取与所述展示内容相关的语音信息,所述语音信息至少包括当前语音片断;使用第一模型网络对所述当前语音片断进行分析,以判断所述当前语音片断所对应的区域,其中所述第一模型网络包括所述第一关键词序列。相应的本发明还公开了一种展示方法、以及相应的用于数据处理的装置和用于展示的装置。通过本发明提供的技术方案,可以实现语音片断与展示内容不同区域的关联,进而实现展示内容按照区域的自动跳转。
-
公开(公告)号:CN101727904B
公开(公告)日:2013-04-24
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN102237081A
公开(公告)日:2011-11-09
申请号:CN201010163229.9
申请日:2010-04-30
Applicant: 国际商业机器公司
CPC classification number: G10L25/48
Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括:接收输入语音数据;获取韵律约束条件;按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及提供所述评估的结果。所述系统包括:输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制,也就是说用户可以根据特定文字/语音进行朗读或者跟读,也可以自由发挥。
-
公开(公告)号:CN101996631A
公开(公告)日:2011-03-30
申请号:CN200910168621.X
申请日:2009-08-28
Applicant: 国际商业机器公司
CPC classification number: G06F17/2827
Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括:获取目标文本和参考文本;以及基于音素相似度,在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法,以及用于自动检索多媒体资源的方法。
-
公开(公告)号:CN105335597A
公开(公告)日:2016-02-17
申请号:CN201410369446.1
申请日:2014-07-30
Applicant: 国际商业机器公司
CPC classification number: G01C21/34 , G01C21/28 , G01C21/30 , G08G1/0112 , G08G1/13
Abstract: 本发明内容涉及用于获取路线的轨迹模式的方法和系统。本发明的一个实施例提供一种用于获取路线的轨迹模式的方法。该方法包括:获取与所述路线相关联的点集,所述点集中的点由沿所述路线行进的一个或多个主体获取;确定覆盖所述点集中的一部分点的多个覆盖区;以及根据所述覆盖区的主方向连接所述覆盖区,以获取关于所述路线的所述轨迹模式,所述主方向表示所述路线在相应覆盖区中的正向。还描述了相应的系统。
-
公开(公告)号:CN104077077A
公开(公告)日:2014-10-01
申请号:CN201310106283.3
申请日:2013-03-29
Applicant: 国际商业机器公司
IPC: G06F3/0489 , G06F3/023 , G06F17/30
CPC classification number: G06F3/0482 , G06F3/018 , G06F3/0236 , G06F3/0237 , G06F17/30861
Abstract: 本发明涉及输入法,其公开了一种调整输入法中的信息提示的方法和装置,该方法包括:获取响应于用户在输入框中输入字符而显示的提示信息;根据所述提示信息调整输入法提示栏中后续提示字符的顺序。根据本发明实施例的调整输入法中的信息提示的方法能够根据提示栏的提示信息实时调整输入法提示栏中提示字符的顺序,便利用户选择。
-
公开(公告)号:CN102385858A
公开(公告)日:2012-03-21
申请号:CN201010271135.3
申请日:2010-08-31
Applicant: 国际商业机器公司
Abstract: 通过本发明可以使语音合成的效果更加自然,更贴近真实的阅读声音。本发明提供一种情感语音合成方法,包括:接收文本数据;对所述文本数据按韵律单元生成情感标记,其中所述情感标记被表示为一组情感矢量,所述情感矢量包括依据多个情感类型所给出的多个情感分数;以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记,而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量,这使得本发明中的韵律单元有更丰富更真实的情感表达,而不是局限于一种情感类型。此外本发明无需人工干预,也就是说无需人工对每句话指定固定的情感标记。
-
公开(公告)号:CN101727904A
公开(公告)日:2010-06-09
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN104700831A
公开(公告)日:2015-06-10
申请号:CN201310652731.X
申请日:2013-12-05
Applicant: 国际商业机器公司
Abstract: 本发明公开了一种分析音频文件的语音特征的方法和装置,该分析方法包括:采用多种声学模型对音频文件中的语音内容进行语音识别,以获得多个识别结果;对比所述多个识别结果以获得对比结果;基于对比结果确定所述音频文件的语音声学特征。分析装置与上述分析方法相对应。本发明还提供了基于以上分析的音频文件的语音特征向用户推荐音频文件的方法和装置。利用本发明实施例的方法和装置,可以对音频文件进行语音分析,从而为用户提供关于音频文件中语音内容特点的丰富信息。基于这样的信息,还可以为用户推荐适合用户水平的音频文件。
-
公开(公告)号:CN103714048A
公开(公告)日:2014-04-09
申请号:CN201210375808.9
申请日:2012-09-29
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G10L15/26 , G06F17/24 , G06F17/273 , G06F17/2863 , G10L15/22 , G10L15/265 , G10L2015/025
Abstract: 本发明涉及语音处理,提供了一种用于校正文本的方法和系统。该方法包括:确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。通过本发明,可以使得用户能够容易地通过语音方式校正文本中的错误。
-
-
-
-
-
-
-
-
-