-
公开(公告)号:CN100535993C
公开(公告)日:2009-09-02
申请号:CN200510086877.8
申请日:2005-11-14
Applicant: 北京大学科技开发部
Abstract: 本发明提供一种在噪声环境中抑止含噪语音中的噪声成分,提高语音质量和可懂度的语音增强方法。根据本发明的方法,具体包括以下步骤:1)首先利用端点检测技术对语音中的噪声谱进行估计;2)利用两步维纳滤波技术去除噪声;3)同时根据听觉掩蔽曲线对滤波参数进行调整。本发明中的去噪方法,在信号层次和听觉感知层次均进行了充分的研究与考虑。对于估计噪声,采用鲁棒性很好的端点检测方法,用之尽可能的准确估计出噪声谱。进一步采用了两步维纳滤波进一步解决这个问题。同时,考虑到人耳的特点,运用听觉掩蔽曲线,使得得到的信号失真减小。这样,最终增强后的信号,在语音质量与可懂度上都有比较大的提高。
-
公开(公告)号:CN1967658A
公开(公告)日:2007-05-23
申请号:CN200510086876.3
申请日:2005-11-14
Applicant: 北京大学科技开发部
IPC: G10L21/02
Abstract: 本发明提出一种小尺度麦克风阵列语音增强系统和方法,根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号,通过AD转换器转化成数字信号,在DSP处理芯片中进行信号增强,然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块,自适应噪声消除模块,信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声,使得采集到的声源信号信噪比提高,从而获得更好的声源信号,在大多情况之下声源信号为语音信号,经过去噪处理对语音的可懂度有所提高。
-
公开(公告)号:CN101510222B
公开(公告)日:2012-05-30
申请号:CN200910131828.X
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统,属于信息检索技术领域。本发明的方法为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块,用于完成自动识别音频文件中文字的任务;自动语音文档索引构建模块,用于完成对语音识别结果构建双重索引的任务;语音文档检索模块,用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比,本发明可实现对多媒体资料的快速准确的查找。
-
公开(公告)号:CN101944362A
公开(公告)日:2011-01-12
申请号:CN201010281033.X
申请日:2010-09-14
Applicant: 北京大学
Abstract: 本发明公开了一种音频无损压缩编码、解码方法,属于信源编、解码领域。本方法根据信号前后帧的相关情况自适应对信号进行分帧,分帧后的一帧信号是信号特性相近的信号组合,使得编码器能获得到更好的压缩效率,为后面的整型小波变换和线性预测编码带来好处。对于无损压缩编码来说,应该对于信号可以完全的重构,所以采用整型提升小波变换来保证信号的完全可重构特性。与现有技术相比,本发明在引入了基于相关的自适应分帧模块和基于整型提升小波的去相关模块后,原始信号中的冗余信息可以被更好的去相关,生成的压缩数据中所含有的冗余信息更少,所以本发明可以用很小的计算复杂度代价换来了较大的压缩比提高。
-
公开(公告)号:CN101520775A
公开(公告)日:2009-09-02
申请号:CN200910131827.5
申请日:2009-04-08
Applicant: 北京大学
IPC: G06F17/27
Abstract: 本发明公开了一种结合语义信息的中文句法分析方法,属于自然语言处理技术领域。本发明的方法为:1)按照知网的上下位关系抽取出词的不同层次的语义类别,得到由词到语义类的索引;2)以句法树中的词作为键值对知网进行查询得到该词的语义类,并将语义类添加到句法树的某一层上;3)将步骤2)处理后的句法树作为训练数据,进行文法训练,得到文法模型;4)利用步骤3)训练后的文法模型对待分析的句子进行解码。与现有技术相比,本发明采用语义信息帮助句法分析消歧,使句法分析效果有显著提升。
-
公开(公告)号:CN100502819C
公开(公告)日:2009-06-24
申请号:CN200510011783.4
申请日:2005-05-24
Applicant: 北京大学科技开发部
IPC: A61F11/04
Abstract: 本发明中提出一种制造适合汉语语音编码策略的人工耳蜗的方法,包括以下几个部分:预加重,语音信号经一阶FIR高通滤波器提升信号中的高频成分;分带滤波,根据人耳听觉特性对语音频带进行等bark尺度划分,分为若干子带,并基于傅氏变换的频域滤波技术对信号进行零相位失真滤波,得到每个子带的信号;准锁相刺激发放,包括过零点检测、包络提取、非线性动态范围压缩、电脉冲发放;过零点检测检测各个频带的信号正向过零点,作为该频带的零相位时刻;包络提取,提取各个子带信号的包络,如利用Hilbert变换来求;非线性动态范围压缩对包络值的动态范围进行非线性压缩;以及电脉冲发放。
-
公开(公告)号:CN101944362B
公开(公告)日:2012-05-30
申请号:CN201010281033.X
申请日:2010-09-14
Applicant: 北京大学
Abstract: 本发明公开了一种音频无损压缩编码、解码方法,属于信源编、解码领域。本方法根据信号前后帧的相关情况自适应对信号进行分帧,分帧后的一帧信号是信号特性相近的信号组合,使得编码器能获得到更好的压缩效率,为后面的整型小波变换和线性预测编码带来好处。对于无损压缩编码来说,应该对于信号可以完全的重构,所以采用整型提升小波变换来保证信号的完全可重构特性。与现有技术相比,本发明在引入了基于相关的自适应分帧模块和基于整型提升小波的去相关模块后,原始信号中的冗余信息可以被更好的去相关,生成的压缩数据中所含有的冗余信息更少,所以本发明可以用很小的计算复杂度代价换来了较大的压缩比提高。
-
公开(公告)号:CN101520775B
公开(公告)日:2012-05-30
申请号:CN200910131827.5
申请日:2009-04-08
Applicant: 北京大学
IPC: G06F17/27
Abstract: 本发明公开了一种结合语义信息的中文句法分析方法,属于自然语言处理技术领域。本发明的方法为:1)按照知网的上下位关系抽取出词的不同层次的语义类别,得到由词到语义类的索引;2)以句法树中的词作为键值对知网进行查询得到该词的语义类,并将语义类添加到句法树的某一层上;3)将步骤2)处理后的句法树作为训练数据,进行文法训练,得到文法模型;4)利用步骤3)训练后的文法模型对待分析的句子进行解码。与现有技术相比,本发明采用语义信息帮助句法分析消歧,使句法分析效果有显著提升。
-
公开(公告)号:CN101510222A
公开(公告)日:2009-08-19
申请号:CN200910131828.X
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种多层索引语音文档检索方法及其系统,属于信息检索技术领域。本发明的方法为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块,用于完成自动识别音频文件中文字的任务;自动语音文档索引构建模块,用于完成对语音识别结果构建双重索引的任务;语音文档检索模块,用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比,本发明可实现对多媒体资料的快速准确的查找。
-
公开(公告)号:CN1870133A
公开(公告)日:2006-11-29
申请号:CN200510011780.0
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。
-
-
-
-
-
-
-
-
-