Patent search ap:("国际商业机器公司") AND inv:"秦勇" Page 2

11.

发明公开
基于模式的音频检索方法和系统有权

公开(公告)号：CN103853749A

公开(公告)日：2014-06-11

申请号：CN201210505562.2

申请日：2012-11-30

Applicant: 国际商业机器公司

Inventor： 张世磊 , 涂旭东 , 金锋 , 金琴 , 刘文 , 秦勇

IPC: G06F17/30

CPC classification number: G06F17/30743

Abstract: 本发明提供了一种基于模式的音频检索方法和系统。所述音频检索方法包括：基于模式对多个源音频数据进行标记，以获取各源音频数据的音频标记序列；获取目标音频数据的音频标记序列；基于目标音频数据的音频标记序列和各源音频数据的音频标记序列，根据预定匹配规则确定目标音频数据与源音频数据之间的匹配度；以及输出匹配度高于预定匹配度阈值的源音频数据，作为检索结果。利用本发明的方法和系统，能够无需人工参与标记而自动基于背景模式迭代地进行音频类标记和检索，从而提供更准确合理的音频检索结果。

12.

发明公开
一种数据处理方法、展示方法和相应的装置无效

公开(公告)号：CN103544140A

公开(公告)日：2014-01-29

申请号：CN201210241787.1

申请日：2012-07-12

Applicant: 国际商业机器公司

Inventor： 张世磊 , 刘文 , 包胜华 , 陈健 , 施勤 , 苏中 , 秦勇

IPC: G06F17/27

CPC classification number: G06F17/27 , G06F17/2765 , G10L15/18 , G10L15/187 , G10L15/22

Abstract: 本发明属于语音识别领域，公开了一种数据处理方法，所述方法包括：获取展示内容对应的文本信息，所述展示内容包括多个区域；对所述文本信息进行文本分析，得到第一关键词序列，所述第一关键词序列包括与所述多个区域中至少一个区域关联的区域关键词；获取与所述展示内容相关的语音信息，所述语音信息至少包括当前语音片断；使用第一模型网络对所述当前语音片断进行分析，以判断所述当前语音片断所对应的区域，其中所述第一模型网络包括所述第一关键词序列。相应的本发明还公开了一种展示方法、以及相应的用于数据处理的装置和用于展示的装置。通过本发明提供的技术方案，可以实现语音片断与展示内容不同区域的关联，进而实现展示内容按照区域的自动跳转。

13.

发明授权
语音翻译方法和装置失效转让

公开(公告)号：CN101727904B

公开(公告)日：2013-04-24

申请号：CN200810174628.8

申请日：2008-10-31

Applicant: 国际商业机器公司

Inventor： 双志伟 , 孟繁平 , 张世磊 , 秦勇

IPC: G10L25/63 , G10L15/18

CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00

Abstract: 提出了一种语音翻译方法，该方法包括：接收源语音；提取源语音中的非文字信息；将源语音翻译为目标语音；以及根据所述提取的非文字信息调整所述翻译的目标语音，从而使得最终的目标语音中保留所述源语音中的非文字信息。

14.

发明公开
语音韵律评估方法与系统失效转让

公开(公告)号：CN102237081A

公开(公告)日：2011-11-09

申请号：CN201010163229.9

申请日：2010-04-30

Applicant: 国际商业机器公司

Inventor： 施琴 , 张世磊 , 双志伟 , 秦勇

IPC: G10L15/00 , G10L15/08 , G10L15/02

CPC classification number: G10L25/48

Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括：接收输入语音数据；获取韵律约束条件；按照所述韵律约束条件对所述输入语音数据的韵律进行评估；以及提供所述评估的结果。所述系统包括：输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制，也就是说用户可以根据特定文字/语音进行朗读或者跟读，也可以自由发挥。

15.

发明公开
用于对齐文本的方法和装置有权复审申请

公开(公告)号：CN101996631A

公开(公告)日：2011-03-30

申请号：CN200910168621.X

申请日：2009-08-28

Applicant: 国际商业机器公司

Inventor： 张世磊 , 施勤 , 双志伟 , 秦勇 , 周杰

IPC: G10L15/26 , G10L13/08

CPC classification number: G06F17/2827

Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括：获取目标文本和参考文本；以及基于音素相似度，在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法，以及用于自动检索多媒体资源的方法。

16.

发明公开
用于自动生成声音文档以及提供声音文档的方法和系统失效

公开(公告)号：CN101242452A

公开(公告)日：2008-08-13

申请号：CN200710007010.8

申请日：2007-02-05

Applicant: 国际商业机器公司

Inventor： 双志伟 , 施勤 , 秦勇 , 孟繁平

IPC: H04M3/493 , H04M3/50

CPC classification number: H04M3/4936 , H04M3/42221 , H04M3/5166 , H04M2203/2011

Abstract: 本发明提出了一种用于自动生成声音文档的方法和系统以及用于提供声音文档的方法和系统。所述自动生成声音文档的方法包括以下步骤：一实时交互式语音应答系统根据信息表单向用户发送提问信息，其中所述信息表单包括分类选择信息槽和至少一个录音片断信息槽；通过所述分类选择信息槽接收用户的分类选择信息，以及通过所述至少一个录音片断信息槽接收用户的录音片断；以及对以上所接收到的信息进行组合而生成声音文档。所述提供声音文档的方法通过信息索取方式或信息派发方式来实现。

17.

发明公开
生成话音纪要的方法、设备和系统无效转让

公开(公告)号：CN1773536A

公开(公告)日：2006-05-17

申请号：CN200410094661.1

申请日：2004-11-11

Applicant: 国际商业机器公司

Inventor： 张龙 , 杨力平 , 刘世霞 , 秦勇

IPC: G06Q10/00

CPC classification number: G06Q10/10 , G10L15/26

Abstract: 一种用于生成话音纪要的方法、设备和系统，所述方法包括步骤：在图形界面上显示外部输入的各段话音流的状态标记及其文字信息；以及通过在图形界面上将所述话音流的各个状态标记拖放到与其相应的文字信息上，来建立每块话音流与相应的文字信息之间的链接，使得所述话音流、文字信息及其对应的链接关系构成链接话音的会议纪要。

18.

发明授权
对语音识别结果中的错误进行校正的方法和语音识别系统失效转让复审申请

公开(公告)号：CN1207664C

公开(公告)日：2005-06-22

申请号：CN99110695.4

申请日：1999-07-27

Applicant: 国际商业机器公司

Inventor： 唐道南 , 苏辉 , 王茜莺 , 沈丽琴 , 秦勇

IPC: G06F11/28 , G10L15/26

CPC classification number: G06K9/6293 , G06K9/726 , G06K2209/01 , G10L15/22

Abstract: 本发明公开了一种可以对语音识别结果中的错误进行校正的方法和语音识别系统。本发明的错误校正方法包括步骤：对输出的语音识别结果中的错误进行标记；用基于字形输入的方法输入与标记的错误相对应的正确字符；对基于字形的输入进行识别；显示候选的正确字符；用户从候选的正确字符中选出所需字符；和使用选出的字符代替错误的字符，所述方法的特征在于还包括步骤：使用错误字符的语音信息来对候选的正确字符进行筛选处理。

19.

发明授权
分析音频文件的语音特征的方法和装置失效

公开(公告)号：CN104700831B

公开(公告)日：2018-03-06

申请号：CN201310652731.X

申请日：2013-12-05

Applicant: 国际商业机器公司

Inventor： 施琴 , 张世磊 , 刘文 , 秦勇

IPC: G10L15/06 , G10L25/51

Abstract: 本发明公开了一种分析音频文件的语音特征的方法和装置，该分析方法包括：采用多种声学模型对音频文件中的语音内容进行语音识别，以获得多个识别结果；对比所述多个识别结果以获得对比结果；基于对比结果确定所述音频文件的语音声学特征。分析装置与上述分析方法相对应。本发明还提供了基于以上分析的音频文件的语音特征向用户推荐音频文件的方法和装置。利用本发明实施例的方法和装置，可以对音频文件进行语音分析，从而为用户提供关于音频文件中语音内容特点的丰富信息。基于这样的信息，还可以为用户推荐适合用户水平的音频文件。

20.

发明授权
用于校正文本的方法和系统有权

公开(公告)号：CN103714048B

公开(公告)日：2017-07-21

申请号：CN201210375808.9

申请日：2012-09-29

Applicant: 国际商业机器公司

Inventor： 张世磊 , 刘文 , 包胜华 , 陈健 , 施琴 , 苏中 , 秦勇

IPC: G06F17/27

CPC classification number: G10L15/26 , G06F17/24 , G06F17/273 , G06F17/2863 , G10L15/22 , G10L15/265 , G10L2015/025

Abstract: 本发明涉及语音处理，提供了一种用于校正文本的方法和系统。该方法包括：确定一个文本中要校正的目标文本单元；接收用户针对所述目标文本单元输入的参考语音片段；根据所述参考语音片段，确定与所述目标文本单元中的字发音相似的参考文本单元；用所述参考文本单元校正所述文本中的所述目标文本单元中的字。通过本发明，可以使得用户能够容易地通过语音方式校正文本中的错误。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification