-
公开(公告)号:CN101030369A
公开(公告)日:2007-09-05
申请号:CN200710064951.5
申请日:2007-03-30
Applicant: 清华大学
IPC: G10L15/14
Abstract: 本发明属于语音识别技术领域,其特征在于,它是一种基于子词隐含马尔可夫模型的嵌入式语音识别方法,包括端点检测、帧同步声学特征提取、计算识别网络解码时用的声学特征矢量序列,以及识别网络解码共四个部分。其中,端点检测采用滑动平均滤波器和有限状态机实现;解码时采用基于滑动窗束搜索的两阶段识别方法,采用基于置信度的方法为第二阶段选取候选词条。本发明在保证识别正确率的条件下,提高识别所需内存占有和运算量的占用效率。同时本发明采用以数字信号处理器为核心的嵌入式实现,具有体积小、重量轻、功耗低、成本低的优点。
-
公开(公告)号:CN1123862C
公开(公告)日:2003-10-08
申请号:CN00105547.X
申请日:2000-03-31
Applicant: 清华大学
Abstract: 本发明属于语音技术领域,涉及基于语音识别专用芯片的特定人语音识别、语音回放方法,包括:语音识别参数提取、特定人语音命令的训练、特定人语音命令的识别、语音回放。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控制、声控拨号、智能性家用电器、学习机、以及生产环节的控制系统中。
-
-
公开(公告)号:CN106601249B
公开(公告)日:2020-06-05
申请号:CN201611026399.6
申请日:2016-11-18
Applicant: 清华大学
IPC: G10L15/24 , G10L21/0208 , G10L21/0224 , G10L13/00
Abstract: 本发明公开了一种基于听觉感知特性的数字语音实时分解/合成方法,涉及语音信号处理领域。本方法包括用N级级联的二阶带通滤波器构成一个N阶的伽马通滤波器再构建任意阶的伽马通数字滤波器模型及其参数,语音分解阶段用M路伽马通滤波器采用浮点算法或定点算法将输入语音分解为M路信号;语音合成阶段在伽马通滤波器组中引入延时,以更加符合人耳特性,人耳基底膜延时与频率成反比关,最后进行语音合成操作。本发明参考了人耳的等响度曲线特性,改进了语音分解合成方法,使得最终语音合成效果接近了理想带通滤波器的效果。本发明可应用在手机、人工耳蜗、助听器等语音设备中。
-
公开(公告)号:CN101082859A
公开(公告)日:2007-12-05
申请号:CN200710118430.3
申请日:2007-07-05
Applicant: 清华大学
Abstract: 本发明公开了一种协处理器,属于集成电路设计领域。所述协处理器包括:存储模块、地址产生模块、寄存器组模块、控制电路模块和计算模块。本发明提供的协处理器可以进行基于HMM语音识别算法的马氏距离计算和乘累加运算,能够提高嵌入式语音识别系统的性能,同时可完成通用DSP中的矢量乘累加运算,扩展了其通用性,具有提高性能,降低成本,降低功耗的优点。
-
公开(公告)号:CN1763843A
公开(公告)日:2006-04-26
申请号:CN200510114848.8
申请日:2005-11-18
Applicant: 清华大学
Abstract: 本发明涉及用于语言学习机的发音质量评价方法,属于计算机辅助语言学习和语音技术领域,包括用于训练的语音特征提取,标准发音模型训练,标准发音网络的生成,语音端点检测,用于评价的语音特征提取,最优路径搜索,以及发音质量分数的计算各部分;本发明的发音质量评价方法具有与主观评价相关性较高、稳健性好等特点。构成的嵌入式英语学习系统可以用于人机交互教学和自动口语测试。
-
-
-
公开(公告)号:CN101030369B
公开(公告)日:2011-06-29
申请号:CN200710064951.5
申请日:2007-03-30
Applicant: 清华大学
IPC: G10L15/14
Abstract: 本发明属于语音识别技术领域,其特征在于,它是一种基于子词隐含马尔可夫模型的嵌入式语音识别方法,包括端点检测、帧同步声学特征提取、计算识别网络解码时用的声学特征矢量序列,以及识别网络解码共四个部分。其中,端点检测采用滑动平均滤波器和有限状态机实现;解码时采用基于滑动窗束搜索的两阶段识别方法,采用基于置信度的方法为第二阶段选取候选词条。本发明在保证识别正确率的条件下,提高识别所需内存占有和运算量的占用效率。同时本发明采用以数字信号处理器为核心的嵌入式实现,具有体积小、重量轻、功耗低、成本低的优点。
-
公开(公告)号:CN1123863C
公开(公告)日:2003-10-08
申请号:CN00130298.1
申请日:2000-11-10
Applicant: 清华大学
Abstract: 本发明属于语音技术领域,涉及基于语音识别的信息校核方法。包括:非特定人语音识别模型的预先训练、语音信号的端点检测、语音识别参数提取、基于多子树三元词对文法的帧同步束搜索Viterbi语音识别方法、语音识别置信测度与拒识模型、非特定人语音识别模型的说话人自适应学习、语音提示。本发明的基于语音识别的信息校核方法具有识别率高、稳健性好等特点。构成的语音识别系统可以用于信息查询、语音命令识别、学习机,以及生产环节的控制系统中。
-
-
-
-
-
-
-
-
-