Patent search ap:("国际商业机器公司") AND inv:"张世磊" Page 3

21.

发明授权
情感语音合成方法和系统有权

公开(公告)号：CN102385858B

公开(公告)日：2013-06-05

申请号：CN201010271135.3

申请日：2010-08-31

Applicant: 国际商业机器公司

Inventor： 双志伟 , 包胜华 , 陈健 , 刘文 , 张世磊 , 苏中 , 施勤 , 秦勇

IPC: G10L13/02

CPC classification number: G10L13/10 , G10L13/02 , G10L13/08

Abstract: 通过本发明可以使语音合成的效果更加自然，更贴近真实的阅读声音。本发明提供一种情感语音合成方法，包括：接收文本数据；对所述文本数据按韵律单元生成情感标记，其中所述情感标记被表示为一组情感矢量，所述情感矢量包括依据多个情感类型所给出的多个情感分数；以及按照所述情感标记对所述文本数据进行语音合成。其中本发明是基于韵律单元生成情感标记，而不是基于整个句子生成情感标记。并且本发明中的情感标记被表示为一组情感矢量，这使得本发明中的韵律单元有更丰富更真实的情感表达，而不是局限于一种情感类型。此外本发明无需人工干预，也就是说无需人工对每句话指定固定的情感标记。

22.

发明公开
具有延迟对象检测的流对象跟踪审中-实审

公开(公告)号：CN114651277A

公开(公告)日：2022-06-21

申请号：CN202080078083.X

申请日：2020-10-26

Applicant: 国际商业机器公司

Inventor： 李玉博 , 王青 , 金科 , 张世磊 , 张洁

IPC: G06T7/20 , G06T7/246 , G06T7/70 , G06T7/73 , G06V20/40

Abstract: 用于使用对象检测算法和对象跟踪算法两者来执行视频图像中的对象的对象跟踪的技术。因为对象检测算法通常比对象跟踪算法更慢但准确，所以仅某些经采样视频帧经受对象检测算法。非采样帧使用对象跟踪算法来定位对象，使用最近的先前对象检测帧作为起始帧。以此方式，通过使用滞后检测结果来隐藏由对象检测算法引入的延迟，使用对象检测算法来周期性地、有效地校准对象跟踪算法。

23.

发明授权
生成音频的图形表示的方法和设备、音频搜索方法和设备失效

公开(公告)号：CN104424955B

公开(公告)日：2018-11-27

申请号：CN201310385132.6

申请日：2013-08-29

Applicant: 国际商业机器公司

Inventor： 廖勤樱 , 张世磊 , 刘文 , 钱伟红

IPC: G10L21/10 , G06F17/30

Abstract: 公开了一种生成音频内容的图形化表示的方法和设备。所述方法包括：获取有关音频内容中要图形化表示的对象的元数据；分析元数据以确定要图形化表示的对象之间的关联关系；从图形化表示元素的集合中选择分别与感兴趣的要图形化表示的对象以及关联关系对应的图形化表示元素；基于所选择的图形化表示元素，生成所述音频内容的图形化表示。通过所述方法和设备，用户能够快速了解音频的具体内容。还公开了在音频内容库中搜索音频内容的方法和设备，通过该方法和设备，用户能够了解特定话题的谈论历史，跟踪话题的演进。

24.

发明授权
基于模式的音频检索方法和系统有权

公开(公告)号：CN103853749B

公开(公告)日：2017-04-26

申请号：CN201210505562.2

申请日：2012-11-30

Applicant: 国际商业机器公司

Inventor： 张世磊 , 涂旭东 , 金锋 , 金琴 , 刘文 , 秦勇

IPC: G06F17/30

Abstract: 本发明提供了一种基于模式的音频检索方法和系统。所述音频检索方法包括：基于模式对多个源音频数据进行标记，以获取各源音频数据的音频标记序列；获取目标音频数据的音频标记序列；基于目标音频数据的音频标记序列和各源音频数据的音频标记序列，根据预定匹配规则确定目标音频数据与源音频数据之间的匹配度；以及输出匹配度高于预定匹配度阈值的源音频数据，作为检索结果。利用本发明的方法和系统，能够无需人工参与标记而自动基于背景模式迭代地进行音频类标记和检索，从而提供更准确合理的音频检索结果。

25.

发明公开
基于语音的生物认证方法及设备失效转让

公开(公告)号：CN104217149A

公开(公告)日：2014-12-17

申请号：CN201310210886.8

申请日：2013-05-31

Applicant: 国际商业机器公司

Inventor： 刘文 , 张世磊 , 包胜华 , 李敏 , 秦勇 , 苏中

IPC: G06F21/32

CPC classification number: G06F21/32 , G06F21/46 , G10L17/02 , G10L17/24

Abstract: 本发明公开了一种用户认证的方法和设备。所述方法包括：向所述用户发送问题提示，所述问题提示要求用户说出语音片段以及动态问题的答案，所述语音片段具有相应的在认证之前训练出的文本相关的说话人识别模型；响应于接收所述语音回答，从述语音回答中切分出所述语音片段部分以及动态问题答案部分；验证所述语音回答中所述语音片段以及动态问题答案之间的边界平滑度。通过所述方法和设备，可以更为有效的防止用户认证时的录音欺诈。

26.

发明授权
语音韵律评估方法与系统失效转让

公开(公告)号：CN102237081B

公开(公告)日：2013-04-24

申请号：CN201010163229.9

申请日：2010-04-30

Applicant: 国际商业机器公司

Inventor： 施琴 , 张世磊 , 双志伟 , 秦勇

IPC: G10L25/48

CPC classification number: G10L25/48

Abstract: 本发明提出了一种对输入语音进行评估的有效方法和系统。所述方法包括：接收输入语音数据；获取韵律约束条件；按照所述韵律约束条件对所述输入语音数据的韵律进行评估；以及提供所述评估的结果。所述系统包括：输入语音数据接收装置、韵律约束条件获取装置、评估装置、以及结果提供装置。本发明对于输入语音数据没有任何限制，也就是说用户可以根据特定文字/语音进行朗读或者跟读，也可以自由发挥。

Patent Agency Ranking