基于子词隐含马尔可夫模型的嵌入式语音识别方法

    公开(公告)号:CN101030369A

    公开(公告)日:2007-09-05

    申请号:CN200710064951.5

    申请日:2007-03-30

    Applicant: 清华大学

    Abstract: 本发明属于语音识别技术领域,其特征在于,它是一种基于子词隐含马尔可夫模型的嵌入式语音识别方法,包括端点检测、帧同步声学特征提取、计算识别网络解码时用的声学特征矢量序列,以及识别网络解码共四个部分。其中,端点检测采用滑动平均滤波器和有限状态机实现;解码时采用基于滑动窗束搜索的两阶段识别方法,采用基于置信度的方法为第二阶段选取候选词条。本发明在保证识别正确率的条件下,提高识别所需内存占有和运算量的占用效率。同时本发明采用以数字信号处理器为核心的嵌入式实现,具有体积小、重量轻、功耗低、成本低的优点。

    基于语音识别专用芯片的非特定人语音识别、语音提示方法

    公开(公告)号:CN1264887A

    公开(公告)日:2000-08-30

    申请号:CN00105548.8

    申请日:2000-03-31

    Applicant: 清华大学

    Abstract: 本发明属于语音技术领域,包括:非特定人语音识别的预先训练、语音识别参数提取、非特定人语音命令的识别、非特定人语音识别的说话人自适应学习、语音提示。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控制、声控拨号、智能性家用电器、学习机、以及生产环节的控制系统中。

    一种基于听觉感知特性的数字语音实时分解/合成方法

    公开(公告)号:CN106601249B

    公开(公告)日:2020-06-05

    申请号:CN201611026399.6

    申请日:2016-11-18

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于听觉感知特性的数字语音实时分解/合成方法,涉及语音信号处理领域。本方法包括用N级级联的二阶带通滤波器构成一个N阶的伽马通滤波器再构建任意阶的伽马通数字滤波器模型及其参数,语音分解阶段用M路伽马通滤波器采用浮点算法或定点算法将输入语音分解为M路信号;语音合成阶段在伽马通滤波器组中引入延时,以更加符合人耳特性,人耳基底膜延时与频率成反比关,最后进行语音合成操作。本发明参考了人耳的等响度曲线特性,改进了语音分解合成方法,使得最终语音合成效果接近了理想带通滤波器的效果。本发明可应用在手机、人工耳蜗、助听器等语音设备中。

    一种协处理器
    15.
    发明公开

    公开(公告)号:CN101082859A

    公开(公告)日:2007-12-05

    申请号:CN200710118430.3

    申请日:2007-07-05

    Applicant: 清华大学

    Abstract: 本发明公开了一种协处理器,属于集成电路设计领域。所述协处理器包括:存储模块、地址产生模块、寄存器组模块、控制电路模块和计算模块。本发明提供的协处理器可以进行基于HMM语音识别算法的马氏距离计算和乘累加运算,能够提高嵌入式语音识别系统的性能,同时可完成通用DSP中的矢量乘累加运算,扩展了其通用性,具有提高性能,降低成本,降低功耗的优点。

    用于语言学习机的发音质量评价方法

    公开(公告)号:CN1763843A

    公开(公告)日:2006-04-26

    申请号:CN200510114848.8

    申请日:2005-11-18

    Applicant: 清华大学

    Abstract: 本发明涉及用于语言学习机的发音质量评价方法,属于计算机辅助语言学习和语音技术领域,包括用于训练的语音特征提取,标准发音模型训练,标准发音网络的生成,语音端点检测,用于评价的语音特征提取,最优路径搜索,以及发音质量分数的计算各部分;本发明的发音质量评价方法具有与主观评价相关性较高、稳健性好等特点。构成的嵌入式英语学习系统可以用于人机交互教学和自动口语测试。

    基于语音识别专用芯片的非特定人语音识别、语音提示方法

    公开(公告)号:CN1141696C

    公开(公告)日:2004-03-10

    申请号:CN00105548.8

    申请日:2000-03-31

    Applicant: 清华大学

    Abstract: 本发明属于语音技术领域,涉及基于语音识别专用芯片的非特定人语音识别、语音提示方法。包括:非特定人语音识别的预先训练、语音识别参数提取、非特定人语音命令的识别、非特定人语音识别的说话人自适应学习、语音提示。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控制、声控拨号、智能性家用电器、学习机、以及生产环节的控制系统中。

    小词汇量语音识别方法及其模块

    公开(公告)号:CN1262502A

    公开(公告)日:2000-08-09

    申请号:CN98124489.0

    申请日:1998-11-13

    Applicant: 清华大学

    Abstract: 本发明属于语音识别技术领域,其方法包括采样、编码,频谱整形及分帧加窗,语音特征提取,端点检测,模式识别等步骤。其模块由码本存储器、采样编码器、信号处理器、微控制器组成。本发明提出的方法,特别解决了非特定人汉语数码语音识别中几个易混淆对的语音区分问题,以提高汉语数码“0”~“9”的语音识别性能。且采用该方法实现的语音识别模块具有体积小、重量轻、耗电省、成本低等突出特点。

    基于子词隐含马尔可夫模型的嵌入式语音识别方法

    公开(公告)号:CN101030369B

    公开(公告)日:2011-06-29

    申请号:CN200710064951.5

    申请日:2007-03-30

    Applicant: 清华大学

    Abstract: 本发明属于语音识别技术领域,其特征在于,它是一种基于子词隐含马尔可夫模型的嵌入式语音识别方法,包括端点检测、帧同步声学特征提取、计算识别网络解码时用的声学特征矢量序列,以及识别网络解码共四个部分。其中,端点检测采用滑动平均滤波器和有限状态机实现;解码时采用基于滑动窗束搜索的两阶段识别方法,采用基于置信度的方法为第二阶段选取候选词条。本发明在保证识别正确率的条件下,提高识别所需内存占有和运算量的占用效率。同时本发明采用以数字信号处理器为核心的嵌入式实现,具有体积小、重量轻、功耗低、成本低的优点。

    基于语音识别的信息校核方法

    公开(公告)号:CN1123863C

    公开(公告)日:2003-10-08

    申请号:CN00130298.1

    申请日:2000-11-10

    Applicant: 清华大学

    Abstract: 本发明属于语音技术领域,涉及基于语音识别的信息校核方法。包括:非特定人语音识别模型的预先训练、语音信号的端点检测、语音识别参数提取、基于多子树三元词对文法的帧同步束搜索Viterbi语音识别方法、语音识别置信测度与拒识模型、非特定人语音识别模型的说话人自适应学习、语音提示。本发明的基于语音识别的信息校核方法具有识别率高、稳健性好等特点。构成的语音识别系统可以用于信息查询、语音命令识别、学习机,以及生产环节的控制系统中。

Patent Agency Ranking