Patent search ap:("国际商业机器公司") AND inv:"秦勇" Page 1

1.

发明公开
分析音频文件的语音特征的方法和装置失效

公开(公告)号：CN104700831A

公开(公告)日：2015-06-10

申请号：CN201310652731.X

申请日：2013-12-05

Applicant: 国际商业机器公司

Inventor： 施琴 , 张世磊 , 刘文 , 秦勇

IPC: G10L15/06 , G10L25/51

Abstract: 本发明公开了一种分析音频文件的语音特征的方法和装置，该分析方法包括：采用多种声学模型对音频文件中的语音内容进行语音识别，以获得多个识别结果；对比所述多个识别结果以获得对比结果；基于对比结果确定所述音频文件的语音声学特征。分析装置与上述分析方法相对应。本发明还提供了基于以上分析的音频文件的语音特征向用户推荐音频文件的方法和装置。利用本发明实施例的方法和装置，可以对音频文件进行语音分析，从而为用户提供关于音频文件中语音内容特点的丰富信息。基于这样的信息，还可以为用户推荐适合用户水平的音频文件。

2.

发明公开
用于校正文本的方法和系统有权

公开(公告)号：CN103714048A

公开(公告)日：2014-04-09

申请号：CN201210375808.9

申请日：2012-09-29

Applicant: 国际商业机器公司

Inventor： 张世磊 , 刘文 , 包胜华 , 陈健 , 施琴 , 苏中 , 秦勇

IPC: G06F17/27

CPC classification number: G10L15/26 , G06F17/24 , G06F17/273 , G06F17/2863 , G10L15/22 , G10L15/265 , G10L2015/025

Abstract: 本发明涉及语音处理，提供了一种用于校正文本的方法和系统。该方法包括：确定一个文本中要校正的目标文本单元；接收用户针对所述目标文本单元输入的参考语音片段；根据所述参考语音片段，确定与所述目标文本单元中的字发音相似的参考文本单元；用所述参考文本单元校正所述文本中的所述目标文本单元中的字。通过本发明，可以使得用户能够容易地通过语音方式校正文本中的错误。

3.

发明授权
情感语音合成方法和系统有权

公开(公告)号：CN102385858B

公开(公告)日：2013-06-05

申请号：CN201010271135.3

申请日：2010-08-31

Applicant: 国际商业机器公司

Inventor： 双志伟 , 包胜华 , 陈健 , 刘文 , 张世磊 , 苏中 , 施勤 , 秦勇

IPC: G10L13/02

CPC classification number: G10L13/10 , G10L13/02 , G10L13/08

Abstract: 通过本发明可以使语音合成的效果更加自然，更贴近真实的阅读声音。本发明提供一种情感语音合成方法，包括：接收文本数据；对所述文本数据按韵律单元生成情感标记，其中所述情感标记被表示为一组情感矢量，所述情感矢量包括依据多个情感类型所给出的多个情感分数；以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记，而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量，这使得本发明中的韵律单元有更丰富更真实的情感表达，而不是局限于一种情感类型。此外本发明无需人工干预，也就是说无需人工对每句话指定固定的情感标记。

4.

发明授权
用于实时网络通信的方法、实时多语种通信的方法及系统失效

公开(公告)号：CN102017513B

公开(公告)日：2013-05-22

申请号：CN200980115671.X

申请日：2009-03-10

Applicant: 国际商业机器公司

Inventor： S·P·卡斯凯伊 , 蒋丹宁 , 刘文 , D·鲁本斯基 , 秦勇 , A·萨克拉达 , 吴澄

IPC: H04L9/32

CPC classification number: G06F17/289 , H04L63/0442 , H04L63/104

Abstract: 一种用于实时网络通信的系统及方法，提供会话标识符(会话ID)作为用于在客户端之间的群组通信(20，22)的公开密钥，并且提供表示多个客户端(12)中的每一个的私有密钥的频道标识符(频道ID)。该频道标识符包括客户端特定属性，该属性用以指示该群组通信的分组准则。基于该公开密钥及私有密钥组合经由网络建立介于客户端(12)与服务(14)之间的动态通信链路，以使得基于该私有密钥及该公开密钥的该属性而实现群组通信。通过使用翻译服务(16)来翻译通信，该翻译服务(16)使用与该私有密钥及该公开密钥的组合相关联的该属性而以指定语言提供响应信息以实现多语种实时通信。

5.

发明公开
调整输入法中的信息提示的方法和装置无效

公开(公告)号：CN104077077A

公开(公告)日：2014-10-01

申请号：CN201310106283.3

申请日：2013-03-29

Applicant: 国际商业机器公司

Inventor： 包胜华 , 陈健 , 张世磊 , 刘文 , 施勤 , 苏中 , 秦勇

IPC: G06F3/0489 , G06F3/023 , G06F17/30

CPC classification number: G06F3/0482 , G06F3/018 , G06F3/0236 , G06F3/0237 , G06F17/30861

Abstract: 本发明涉及输入法，其公开了一种调整输入法中的信息提示的方法和装置，该方法包括：获取响应于用户在输入框中输入字符而显示的提示信息；根据所述提示信息调整输入法提示栏中后续提示字符的顺序。根据本发明实施例的调整输入法中的信息提示的方法能够根据提示栏的提示信息实时调整输入法提示栏中提示字符的顺序，便利用户选择。

6.

发明授权
用于自动生成声音文档以及提供声音文档的方法和系统失效

公开(公告)号：CN101242452B

公开(公告)日：2013-01-23

申请号：CN200710007010.8

申请日：2007-02-05

Applicant: 国际商业机器公司

Inventor： 双志伟 , 施勤 , 秦勇 , 孟繁平

IPC: H04M3/493 , H04M3/50

CPC classification number: H04M3/4936 , H04M3/42221 , H04M3/5166 , H04M2203/2011

Abstract: 本发明提出了一种用于自动生成声音文档的方法和系统以及用于提供声音文档的方法和系统。所述自动生成声音文档的方法包括以下步骤：一实时交互式语音应答系统根据信息表单向用户发送提问信息，其中所述信息表单包括分类选择信息槽和至少一个录音片断信息槽；通过所述分类选择信息槽接收用户的分类选择信息，以及通过所述至少一个录音片断信息槽接收用户的录音片断；以及对以上所接收到的信息进行组合而生成声音文档。所述提供声音文档的方法通过信息索取方式或信息派发方式来实现。

7.

发明公开
情感语音合成方法和系统有权

公开(公告)号：CN102385858A

公开(公告)日：2012-03-21

申请号：CN201010271135.3

申请日：2010-08-31

Applicant: 国际商业机器公司

Inventor： 双志伟 , 包胜华 , 陈健 , 刘文 , 张世磊 , 苏中 , 施勤 , 秦勇

IPC: G10L13/00 , G10L13/06

CPC classification number: G10L13/10 , G10L13/02 , G10L13/08

Abstract: 通过本发明可以使语音合成的效果更加自然，更贴近真实的阅读声音。本发明提供一种情感语音合成方法，包括：接收文本数据；对所述文本数据按韵律单元生成情感标记，其中所述情感标记被表示为一组情感矢量，所述情感矢量包括依据多个情感类型所给出的多个情感分数；以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记，而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量，这使得本发明中的韵律单元有更丰富更真实的情感表达，而不是局限于一种情感类型。此外本发明无需人工干预，也就是说无需人工对每句话指定固定的情感标记。

8.

发明公开
语音翻译方法和装置失效转让

公开(公告)号：CN101727904A

公开(公告)日：2010-06-09

申请号：CN200810174628.8

申请日：2008-10-31

Applicant: 国际商业机器公司

Inventor： 双志伟 , 孟繁平 , 张世磊 , 秦勇

IPC: G10L15/28 , G10L13/02 , G10L13/08

CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00

Abstract: 提出了一种语音翻译方法，该方法包括：接收源语音；提取源语音中的非文字信息；将源语音翻译为目标语音；以及根据所述提取的非文字信息调整所述翻译的目标语音，从而使得最终的目标语音中保留所述源语音中的非文字信息。

9.

发明授权
基于语音的生物认证方法及设备失效转让

公开(公告)号：CN104217149B

公开(公告)日：2017-05-24

申请号：CN201310210886.8

申请日：2013-05-31

Applicant: 国际商业机器公司

Inventor： 刘文 , 张世磊 , 包胜华 , 李敏 , 秦勇 , 苏中

IPC: G06F21/32

CPC classification number: G06F21/32 , G06F21/46 , G10L17/02 , G10L17/24

Abstract: 本发明公开了一种用户认证的方法和设备。所述方法包括：向所述用户发送问题提示，所述问题提示要求用户说出语音片段以及动态问题的答案，所述语音片段具有相应的在认证之前训练出的文本相关的说话人识别模型；响应于接收所述语音回答，从述语音回答中切分出所述语音片段部分以及动态问题答案部分；验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。通过所述方法和设备，可以更为有效的防止用户认证时的录音欺诈。

10.

发明授权
用于对齐文本的方法和装置有权复审申请

公开(公告)号：CN101996631B

公开(公告)日：2014-12-03

申请号：CN200910168621.X

申请日：2009-08-28

Applicant: 国际商业机器公司

Inventor： 张世磊 , 施勤 , 双志伟 , 秦勇 , 周杰

IPC: G10L15/26 , G10L13/08

CPC classification number: G06F17/2827

Abstract: 本发明公开了一种用于对齐文本的方法和装置。该方法包括：获取目标文本和参考文本；以及基于音素相似度，在字的级别对齐目标文本和参考文本。本发明还公开了应用上述方法的用于自动归档多媒体资源的方法，以及用于自动检索多媒体资源的方法。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification