基于高斯相似度分析的说话人自适应方法

    公开(公告)号:CN1521727A

    公开(公告)日:2004-08-18

    申请号:CN03102205.7

    申请日:2003-01-27

    Inventor: 吴及 王作英

    Abstract: 本发明提供了一种基于高斯相似度分析的说话人自适应方法,包括一个自适应前建立非特定人模型状态协方差矩阵的二叉决策树的步骤;一个建立计算二叉决策树每个中间节点的类中心协方差矩阵及其与对应的各叶子节点协方差矩阵间的变换关系阵的步骤;一个自适应时根据测试者提供的自适应数据决定自适应状态类的步骤;一个对每个自适应状态类用最大似然方法估计类中心矩阵的步骤;一个对每个自适应状态类计算自适应后的类中心协方差矩阵的步骤;一个更新每个自适应状态类的协方差矩阵,得到说话人自适应模型的步骤。本发明能够利用少量数据对协方差自适应,而且可以与均值自适应方法同时使用,自适应效果显著。

    一种门限自适应的语音检测系统

    公开(公告)号:CN1540623A

    公开(公告)日:2004-10-27

    申请号:CN200310103263.7

    申请日:2003-11-04

    Applicant: 清华大学

    Inventor: 吴及 王作英 田野

    Abstract: 本发明提供了一种可以在线的、不需要预先获得录音信道音量的语音检测系统,包括语音采集装置、基于门限的语音检测装置、门限更新装置。与现有语音检测系统比较,该系统具有很好的稳健性,能够找到合适介于无声平均能量和语音平均能量中间的检测门限,同时取得比较高的语音检测率和背景噪声检测率。此外,该系统还能够快速的跟踪背景噪声的变化,在平稳和非平稳背景环境下都可以很好的工作。

    一种高精度数字式自动控制装置

    公开(公告)号:CN1006350B

    公开(公告)日:1990-01-03

    申请号:CN87106461

    申请日:1987-09-24

    Applicant: 清华大学

    Inventor: 王作英 徐士良

    Abstract: 本发明属于自动控制技术领域,可用于计算机的绘图机控制、机床程序控制、自动火炮指挥仪控制等。本发明采用了正、反转脉冲分离逻辑电路、差分式速度/电压转换电路、线性一饱和限幅工作状态D/A及速度、加速度顺馈通道。本发明具有工作稳定、可靠、控制精度高(可达微米量级),且具有电路简单调试方便等优点。

    基于高斯相似度分析的说话人自适应方法

    公开(公告)号:CN1221938C

    公开(公告)日:2005-10-05

    申请号:CN03102205.7

    申请日:2003-01-27

    Inventor: 吴及 王作英

    Abstract: 本发明提供了一种基于高斯相似度分析的说话人自适应方法,包括一个自适应前建立非特定人模型状态协方差矩阵的二叉决策树的步骤;一个建立计算二叉决策树每个中间节点的类中心协方差矩阵及其与对应的各叶子节点协方差矩阵间的变换关系阵的步骤;一个自适应时根据测试者提供的自适应数据决定自适应状态类的步骤;一个对每个自适应状态类用最大似然方法估计类中心矩阵的步骤;一个对每个自适应状态类计算自适应后的类中心协方差矩阵的步骤;一个更新每个自适应状态类的协方差矩阵,得到说话人自适应模型的步骤。本发明能够利用少量数据对协方差自适应,而且可以与均值自适应方法同时使用,自适应效果显著。

    语速自适应的语音识别系统

    公开(公告)号:CN1221937C

    公开(公告)日:2005-10-05

    申请号:CN02159406.6

    申请日:2002-12-31

    Abstract: 本发明提供了一种可以在线的、不需要预先获得语速的测度、同时增加的计算量很小的语速自适应的语音识别系统,包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块,训练模块训练的模型参数包括前后两个语音单元相连的情况下的段长均值、方差和前后两个语音单元段长的相关系数;声学层识别模块计算的段长概率,是指给定前一个音节的段长的条件下,计算当前音节段长的条件概率,并且在计算段长概率时,可以通过段长概率动态加权模块和汉语慢速语音调整模块对段长概率根据语速进行动态、实时调整,以提高系统性能,降低系统的插入错误和删除错误。

    语音识别系统中的说话人自适应方法

    公开(公告)号:CN1521728A

    公开(公告)日:2004-08-18

    申请号:CN03102206.5

    申请日:2003-01-27

    Inventor: 吴及 王作英 吕萍

    Abstract: 本发明提供了一种语音识别系统中的说话人自适应方法,称为最大高斯相似度协方差矩阵线性插值方法,能够克服基于高斯相似度的二叉决策树方法中在自适应数据极少的情况下的缺点。本发明主要步骤是:自适应前,首先与基于高斯相似度分析的二叉决策树自适应方法一样,根据非特定人模型建立起协方差矩阵二叉决策树;然后,按照该决策树计算在各特定人模型下中间节点对应的类中心矩阵。自适应时,先由测试者提供的数据量决定,在哪些中间节点上进行插值自适应,接着根据每一待插值的中间节点对应的自适应数据,计算插值系数,最后计算自适应后的类中心矩阵,更新协方差矩阵,得到自适应模型。

    语音识别系统中的说话人自适应方法

    公开(公告)号:CN1221939C

    公开(公告)日:2005-10-05

    申请号:CN03102206.5

    申请日:2003-01-27

    Inventor: 吴及 王作英 吕萍

    Abstract: 本发明提供了一种语音识别系统中的说话人自适应方法,称为最大高斯相似度协方差矩阵线性插值方法,能够克服基于高斯相似度的二叉决策树方法中在自适应数据极少的情况下的缺点。本发明主要步骤是:自适应前,首先与基于高斯相似度分析的二叉决策树自适应方法一样,根据非特定人模型建立起协方差矩阵二叉决策树;然后,按照该决策树计算在各特定人模型下中间节点对应的类中心矩阵。自适应时,先由测试者提供的数据量决定,在哪些中间节点上进行插值自适应,接着根据每一待插值的中间节点对应的自适应数据,计算插值系数,最后计算自适应后的类中心矩阵,更新协方差矩阵,得到自适应模型。

    语速自适应的语音识别系统

    公开(公告)号:CN1512485A

    公开(公告)日:2004-07-14

    申请号:CN02159406.6

    申请日:2002-12-31

    Abstract: 本发明提供了一种可以在线的、不需要预先获得语速的测度、同时增加的计算量很小的语速自适应的语音识别系统,包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块,训练模块训练的模型参数包括前后两个语音单元相连的情况下的段长均值、方差和前后两个语音单元段长的相关系数;声学层识别模块计算的段长概率,是指给定前一个音节的段长的条件下,计算当前音节段长的条件概率,并且在计算段长概率时,可以通过段长概率动态加权模块和汉语慢速语音调整模块对段长概率根据语速进行动态、实时调整,以提高系统性能,降低系统的插入错误和删除错误。

    一种高精度数字式自动控制装置

    公开(公告)号:CN87106461A

    公开(公告)日:1988-04-13

    申请号:CN87106461

    申请日:1987-09-24

    Applicant: 清华大学

    Inventor: 王作英 徐士良

    Abstract: 本发明属于自动控制技术领域,可用于计算机的绘图机控制、机床程序控制、自动火炮指挥仪控制等。本发明采用了正、反转脉冲分离逻辑电路、差分式速率/电压转换电路、线性一饱和限幅工作状态D/A及速度、加速度顺馈通道。本发明具有工作稳定、可靠、控制精度高(可达微米量级),且具有电路简单调试方便等优点。

Patent Agency Ranking