-
公开(公告)号:CN101593522A
公开(公告)日:2009-12-02
申请号:CN200910088578.6
申请日:2009-07-08
Applicant: 清华大学
Abstract: 本发明实施例提供了一种全频域数字助听方法,方法包括:获取前后双麦克风的输入语音信号,并进行分帧和傅里叶变换,以及进行语音场景类别的识别;当为带噪语音时,对分帧语音频域信号进行噪声检测并进行双麦克风波束形成处理、风噪声处理以及其它噪声抑制,然后进行频域动态范围压缩,以及声学反馈抑制;最后,进行反傅里叶变换和重叠相加得到输出语音信号。本发明实施例还提供了一种全频域数字助听设备。通过本发明实施例提供的方案,解决了目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合考虑影响使用效果各方面因素的问题,同时本发明实施例提供了全频域的数字助听方案,具有处理速度快,占用资源少,能耗低等优点。
-
公开(公告)号:CN100489765C
公开(公告)日:2009-05-20
申请号:CN200710118430.3
申请日:2007-07-05
Applicant: 清华大学
Abstract: 本发明公开了一种协处理器,属于集成电路设计领域。所述协处理器包括:存储模块、地址产生模块、寄存器组模块、控制电路模块和计算模块。本发明提供的协处理器可以进行基于HMM语音识别算法的马氏距离计算和乘累加运算,能够提高嵌入式语音识别系统的性能,同时可完成通用DSP中的矢量乘累加运算,扩展了其通用性,具有提高性能,降低成本,降低功耗的优点。
-
公开(公告)号:CN102456351A
公开(公告)日:2012-05-16
申请号:CN201010515293.9
申请日:2010-10-14
Applicant: 清华大学
Abstract: 本发明提供了一种语音增强的系统,通过特定的双麦克结构,模拟人耳的听觉场景分析能力来实现语音增强,具有与噪声类型无关的特点,可广泛应用于各类噪声环境下的语音增强,利用计算听觉场景分析的原理,将目标语音从背景噪声中进行分离,从而实现去噪,从而实现了与噪声的具体类型、各种噪声源的个数、目标声源与噪声源的空间拓扑结构无关,在实现较好去噪效果的同时保证较高的语音质量。
-
公开(公告)号:CN101030369B
公开(公告)日:2011-06-29
申请号:CN200710064951.5
申请日:2007-03-30
Applicant: 清华大学
IPC: G10L15/14
Abstract: 本发明属于语音识别技术领域,其特征在于,它是一种基于子词隐含马尔可夫模型的嵌入式语音识别方法,包括端点检测、帧同步声学特征提取、计算识别网络解码时用的声学特征矢量序列,以及识别网络解码共四个部分。其中,端点检测采用滑动平均滤波器和有限状态机实现;解码时采用基于滑动窗束搜索的两阶段识别方法,采用基于置信度的方法为第二阶段选取候选词条。本发明在保证识别正确率的条件下,提高识别所需内存占有和运算量的占用效率。同时本发明采用以数字信号处理器为核心的嵌入式实现,具有体积小、重量轻、功耗低、成本低的优点。
-
公开(公告)号:CN100411011C
公开(公告)日:2008-08-13
申请号:CN200510114848.8
申请日:2005-11-18
Applicant: 清华大学
Abstract: 本发明涉及用于语言学习机的发音质量评价方法,属于计算机辅助语言学习和语音技术领域,包括用于训练的语音特征提取,标准发音模型训练,标准发音网络的生成,语音端点检测,用于评价的语音特征提取,最优路径搜索,以及发音质量分数的计算各部分;本发明的发音质量评价方法具有与主观评价相关性较高、稳健性好等特点。构成的嵌入式英语学习系统可以用于人机交互教学和自动口语测试。
-
公开(公告)号:CN101082859A
公开(公告)日:2007-12-05
申请号:CN200710118430.3
申请日:2007-07-05
Applicant: 清华大学
Abstract: 本发明公开了一种协处理器,属于集成电路设计领域。所述协处理器包括:存储模块、地址产生模块、寄存器组模块、控制电路模块和计算模块。本发明提供的协处理器可以进行基于HMM语音识别算法的马氏距离计算和乘累加运算,能够提高嵌入式语音识别系统的性能,同时可完成通用DSP中的矢量乘累加运算,扩展了其通用性,具有提高性能,降低成本,降低功耗的优点。
-
公开(公告)号:CN1763843A
公开(公告)日:2006-04-26
申请号:CN200510114848.8
申请日:2005-11-18
Applicant: 清华大学
Abstract: 本发明涉及用于语言学习机的发音质量评价方法,属于计算机辅助语言学习和语音技术领域,包括用于训练的语音特征提取,标准发音模型训练,标准发音网络的生成,语音端点检测,用于评价的语音特征提取,最优路径搜索,以及发音质量分数的计算各部分;本发明的发音质量评价方法具有与主观评价相关性较高、稳健性好等特点。构成的嵌入式英语学习系统可以用于人机交互教学和自动口语测试。
-
公开(公告)号:CN102157156B
公开(公告)日:2012-10-10
申请号:CN201110067058.4
申请日:2011-03-21
Applicant: 清华大学
IPC: G10L21/02
Abstract: 本发明提供了一种单通道语音增强的方法和系统,所述方法包括:通过语音激活检测从带噪语音信号中提取噪声信号;通过外围分析分别对带噪语音信号和噪声信号进行外耳、内耳和中耳的模拟处理;通过特征提取获取模拟处理后的带噪语音信号和噪声信号的每一个时频单元的能量差;对每一个时频单元的能量差生成不同的掩蔽值并进行加权,得到掩蔽处理信号;通过对掩蔽处理信号和模拟处理后的带噪语音信号进行语音信号的重建,获得语音增强信号。本发明可以降低对目标语音信号的损伤,并在多种噪声环境下,均能实现较好的去噪效果并保持较高的语音质量。
-
公开(公告)号:CN101593522B
公开(公告)日:2011-09-14
申请号:CN200910088578.6
申请日:2009-07-08
Applicant: 清华大学
Abstract: 本发明实施例提供了一种全频域数字助听方法,方法包括:获取前后双麦克风的输入语音信号,并进行分帧和傅里叶变换,以及进行语音场景类别的识别;当为带噪语音时,对分帧语音频域信号进行噪声检测并进行双麦克风波束形成处理、风噪声处理以及其它噪声抑制,然后进行频域动态范围压缩,以及声学反馈抑制;最后,进行反傅里叶变换和重叠相加得到输出语音信号。本发明实施例还提供了一种全频域数字助听设备。通过本发明实施例提供的方案,解决了目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合考虑影响使用效果各方面因素的问题,同时本发明实施例提供了全频域的数字助听方案,具有处理速度快,占用资源少,能耗低等优点。
-
公开(公告)号:CN102157156A
公开(公告)日:2011-08-17
申请号:CN201110067058.4
申请日:2011-03-21
Applicant: 清华大学
IPC: G10L21/02
Abstract: 本发明提供了一种单通道语音增强的方法和系统,所述方法包括:通过语音激活检测从带噪语音信号中提取噪声信号;通过外围分析分别对带噪语音信号和噪声信号进行外耳、内耳和中耳的模拟处理;通过特征提取获取模拟处理后的带噪语音信号和噪声信号的每一个时频单元的能量差;对每一个时频单元的能量差生成不同的掩蔽值并进行加权,得到掩蔽处理信号;通过对掩蔽处理信号和模拟处理后的带噪语音信号进行语音信号的重建,获得语音增强信号。本发明可以降低对目标语音信号的损伤,并在多种噪声环境下,均能实现较好的去噪效果并保持较高的语音质量。
-
-
-
-
-
-
-
-
-