-
公开(公告)号:CN103853749A
公开(公告)日:2014-06-11
申请号:CN201210505562.2
申请日:2012-11-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30743
Abstract: 本发明提供了一种基于模式的音频检索方法和系统。所述音频检索方法包括:基于模式对多个源音频数据进行标记,以获取各源音频数据的音频标记序列;获取目标音频数据的音频标记序列;基于目标音频数据的音频标记序列和各源音频数据的音频标记序列,根据预定匹配规则确定目标音频数据与源音频数据之间的匹配度;以及输出匹配度高于预定匹配度阈值的源音频数据,作为检索结果。利用本发明的方法和系统,能够无需人工参与标记而自动基于背景模式迭代地进行音频类标记和检索,从而提供更准确合理的音频检索结果。
-
公开(公告)号:CN103544140A
公开(公告)日:2014-01-29
申请号:CN201210241787.1
申请日:2012-07-12
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G06F17/27 , G06F17/2765 , G10L15/18 , G10L15/187 , G10L15/22
Abstract: 本发明属于语音识别领域,公开了一种数据处理方法,所述方法包括:获取展示内容对应的文本信息,所述展示内容包括多个区域;对所述文本信息进行文本分析,得到第一关键词序列,所述第一关键词序列包括与所述多个区域中至少一个区域关联的区域关键词;获取与所述展示内容相关的语音信息,所述语音信息至少包括当前语音片断;使用第一模型网络对所述当前语音片断进行分析,以判断所述当前语音片断所对应的区域,其中所述第一模型网络包括所述第一关键词序列。相应的本发明还公开了一种展示方法、以及相应的用于数据处理的装置和用于展示的装置。通过本发明提供的技术方案,可以实现语音片断与展示内容不同区域的关联,进而实现展示内容按照区域的自动跳转。
-
公开(公告)号:CN101727904B
公开(公告)日:2013-04-24
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN102237081A
公开(公告)日:2011-11-09
申请号:CN201010163229.9
申请日:2010-04-30
Applicant: 国际商业机器公司
CPC classification number: G10L25/48
Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括:接收输入语音数据;获取韵律约束条件;按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及提供所述评估的结果。所述系统包括:输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制,也就是说用户可以根据特定文字/语音进行朗读或者跟读,也可以自由发挥。
-
公开(公告)号:CN101996631A
公开(公告)日:2011-03-30
申请号:CN200910168621.X
申请日:2009-08-28
Applicant: 国际商业机器公司
CPC classification number: G06F17/2827
Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括:获取目标文本和参考文本;以及基于音素相似度,在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法,以及用于自动检索多媒体资源的方法。
-
公开(公告)号:CN101242452A
公开(公告)日:2008-08-13
申请号:CN200710007010.8
申请日:2007-02-05
Applicant: 国际商业机器公司
CPC classification number: H04M3/4936 , H04M3/42221 , H04M3/5166 , H04M2203/2011
Abstract: 本发明提出了一种用于自动生成声音文档的方法和系统以及用于提供声音文档的方法和系统。所述自动生成声音文档的方法包括以下步骤:一实时交互式语音应答系统根据信息表单向用户发送提问信息,其中所述信息表单包括分类选择信息槽和至少一个录音片断信息槽;通过所述分类选择信息槽接收用户的分类选择信息,以及通过所述至少一个录音片断信息槽接收用户的录音片断;以及对以上所接收到的信息进行组合而生成声音文档。所述提供声音文档的方法通过信息索取方式或信息派发方式来实现。
-
-
公开(公告)号:CN1207664C
公开(公告)日:2005-06-22
申请号:CN99110695.4
申请日:1999-07-27
Applicant: 国际商业机器公司
CPC classification number: G06K9/6293 , G06K9/726 , G06K2209/01 , G10L15/22
Abstract: 本发明公开了一种可以对语音识别结果中的错误进行校正的方法和语音识别系统。本发明的错误校正方法包括步骤:对输出的语音识别结果中的错误进行标记;用基于字形输入的方法输入与标记的错误相对应的正确字符;对基于字形的输入进行识别;显示候选的正确字符;用户从候选的正确字符中选出所需字符;和使用选出的字符代替错误的字符,所述方法的特征在于还包括步骤:使用错误字符的语音信息来对候选的正确字符进行筛选处理。
-
公开(公告)号:CN104700831B
公开(公告)日:2018-03-06
申请号:CN201310652731.X
申请日:2013-12-05
Applicant: 国际商业机器公司
Abstract: 本发明公开了一种分析音频文件的语音特征的方法和装置,该分析方法包括:采用多种声学模型对音频文件中的语音内容进行语音识别,以获得多个识别结果;对比所述多个识别结果以获得对比结果;基于对比结果确定所述音频文件的语音声学特征。分析装置与上述分析方法相对应。本发明还提供了基于以上分析的音频文件的语音特征向用户推荐音频文件的方法和装置。利用本发明实施例的方法和装置,可以对音频文件进行语音分析,从而为用户提供关于音频文件中语音内容特点的丰富信息。基于这样的信息,还可以为用户推荐适合用户水平的音频文件。
-
公开(公告)号:CN103714048B
公开(公告)日:2017-07-21
申请号:CN201210375808.9
申请日:2012-09-29
Applicant: 国际商业机器公司
IPC: G06F17/27
CPC classification number: G10L15/26 , G06F17/24 , G06F17/273 , G06F17/2863 , G10L15/22 , G10L15/265 , G10L2015/025
Abstract: 本发明涉及语音处理,提供了一种用于校正文本的方法和系统。该方法包括:确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。通过本发明,可以使得用户能够容易地通过语音方式校正文本中的错误。
-
-
-
-
-
-
-
-
-