-
公开(公告)号:CN102075695A
公开(公告)日:2011-05-25
申请号:CN201010616492.9
申请日:2010-12-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种面向海量广播电视节目的新一代智能编目系统和方法,其初始化模块可自动发现广播电视节目片头曲、片尾曲及广告片段;节目打点模块可对广播电视节目的起止点进行自动标记,并发现新出现的广播电视节目;新闻拆条模块可对新闻节目的条目起止点进行自动标记;广告抽取模块可对广播电视节目中播放广告的起止点进行自动标记,并发现新出现的广告;节目编目模块可对广播电视节目内容进行自动标记;多媒体检索模块可为用户提供经过编目和索引的广播电视节目数据的多媒体检索能力;上述模块提供的处理结果,经人工确认后,输入知识库管理与学习模块,进行学习并更新上述各模块的模型参数,以确保系统在不同应用环境下的适应性和可用性。
-
公开(公告)号:CN102075695B
公开(公告)日:2012-10-10
申请号:CN201010616492.9
申请日:2010-12-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种面向海量广播电视节目的新一代智能编目系统和方法,其初始化模块可自动发现广播电视节目片头曲、片尾曲及广告片段;节目打点模块可对广播电视节目的起止点进行自动标记,并发现新出现的广播电视节目;新闻拆条模块可对新闻节目的条目起止点进行自动标记;广告抽取模块可对广播电视节目中播放广告的起止点进行自动标记,并发现新出现的广告;节目编目模块可对广播电视节目内容进行自动标记;多媒体检索模块可为用户提供经过编目和索引的广播电视节目数据的多媒体检索能力;上述模块提供的处理结果,经人工确认后,输入知识库管理与学习模块,进行学习并更新上述各模块的模型参数,以确保系统在不同应用环境下的适应性和可用性。
-
公开(公告)号:CN1979638A
公开(公告)日:2007-06-13
申请号:CN200510127447.6
申请日:2005-12-02
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及语音识别技术领域,特别是一种语音识别结果纠错方法。利用可纠错知识库对识别结果进行纠错的方法,该方法的最基本的特征,一是以语料库中的连续语言片段作为纠错模版,利用语料库建立纠错模版库;二是对纠错模版库建立索引,使用检索技术对纠错模版进行快速查找;三是依据纠错模式,利用置信度将识别结果切分成短的识别片段,并将识别片段中的可信赖部分提交的纠错模版系统进行快速查找,得到与识别片段相关性高的纠错模版候选;四是利用声学混淆度矩阵从纠错模版候选中挑选与识别片段声学特征相近的模版进行替换纠错。
-
-