Patent search ap:("北京大学") AND inv:"万广鲁" Page 1

1.

发明公开
一种多层索引语音文档检索方法及其系统失效

公开(公告)号：CN101510222A

公开(公告)日：2009-08-19

申请号：CN200910131828.X

申请日：2009-04-08

Applicant: 北京大学

Inventor： 吴玺宏 , 迟惠生 , 曲天书 , 万广鲁

IPC: G06F17/30 , G10L15/08

Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统，属于信息检索技术领域。本发明的方法为：1)对多媒体流进行特征提取，得到语音特征序列；2)利用语音识别解码器对语音特征序列进行搜索，得到词网格以及最优识别结果；3)根据词网格和最优识别结果，构建词和音子双层索引库；4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块，用于完成自动识别音频文件中文字的任务；自动语音文档索引构建模块，用于完成对语音识别结果构建双重索引的任务；语音文档检索模块，用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比，本发明可实现对多媒体资料的快速准确的查找。

2.

发明授权
一种多层索引语音文档检索方法失效

公开(公告)号：CN101510222B

公开(公告)日：2012-05-30

申请号：CN200910131828.X

申请日：2009-04-08

Applicant: 北京大学

Inventor： 吴玺宏 , 迟惠生 , 曲天书 , 万广鲁

IPC: G06F17/30 , G10L15/08

Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统，属于信息检索技术领域。本发明的方法为：1)对多媒体流进行特征提取，得到语音特征序列；2)利用语音识别解码器对语音特征序列进行搜索，得到词网格以及最优识别结果；3)根据词网格和最优识别结果，构建词和音子双层索引库；4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块，用于完成自动识别音频文件中文字的任务；自动语音文档索引构建模块，用于完成对语音识别结果构建双重索引的任务；语音文档检索模块，用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比，本发明可实现对多媒体资料的快速准确的查找。

Patent Agency Ranking