-
公开(公告)号:CN101510222A
公开(公告)日:2009-08-19
申请号:CN200910131828.X
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统,属于信息检索技术领域。本发明的方法为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块,用于完成自动识别音频文件中文字的任务;自动语音文档索引构建模块,用于完成对语音识别结果构建双重索引的任务;语音文档检索模块,用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比,本发明可实现对多媒体资料的快速准确的查找。
-
公开(公告)号:CN101510222B
公开(公告)日:2012-05-30
申请号:CN200910131828.X
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统,属于信息检索技术领域。本发明的方法为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块,用于完成自动识别音频文件中文字的任务;自动语音文档索引构建模块,用于完成对语音识别结果构建双重索引的任务;语音文档检索模块,用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比,本发明可实现对多媒体资料的快速准确的查找。
-