使用分段线性逼近的连续值声道共振跟踪方法和装置

    公开(公告)号:CN1624765A

    公开(公告)日:2005-06-08

    申请号:CN200410095656.2

    申请日:2004-11-26

    Applicant: 微软公司

    CPC classification number: G10L25/48 G10L25/15

    Abstract: 一种方法和装置跟踪语音信号中的共振分量,包括频率和带宽。通过定义对过去的声道共振矢量线性、且预测当前声道共振矢量的状态方程式来跟踪这些分量。也定义对当前声道共振矢量为线性的、且预测观测矢量的至少一个分量的观测方程式。状态方程式、观测方程式和观测矢量序列用于使用卡尔曼滤波器算法来标识声道共振矢量序列。在一个实施例中,基于对非线性函数的分段线性逼近来定义观测方程式。基于预定义的区域来选择线性逼近的参数,这些区域根据声道共振矢量的粗略估算来确定。

    使用切换状态空间模型的多模变分推导的语音识别方法

    公开(公告)号:CN100589180C

    公开(公告)日:2010-02-10

    申请号:CN200510005936.4

    申请日:2005-01-20

    Applicant: 微软公司

    CPC classification number: G10L15/14 G10L2015/0638

    Abstract: 一种有效设置切换状态空间模型的后验概率参数的方法通过定义包含至少两个但少于全部帧的窗开始。为窗中的每个帧确定个别后验概率参数。然后所述窗在时间上从左到右顺序移位,使得它包括帧序列中一个或多个后续帧。然后为移位后的窗中的每个帧确定个别后验概率参数。该方法精密地逼近更严格的解,但将计算成本节省了两到三个数量级。另外,发明了一种确定切换状态空间模型中的最佳离散状态序列的方法,该方法在逐帧基础上直接利用观测矢量,并在时间上从左到右操作。

    使用切换状态空间模型的多模变分推导的语音识别方法

    公开(公告)号:CN1645476A

    公开(公告)日:2005-07-27

    申请号:CN200510005936.4

    申请日:2005-01-20

    Applicant: 微软公司

    CPC classification number: G10L15/14 G10L2015/0638

    Abstract: 一种有效设置切换状态空间模型的后验概率参数的方法通过定义包含至少两个但少于全部帧的窗开始。为窗中的每个帧确定个别后验概率参数。然后所述窗在时间上从左到右顺序移位,使得它包括帧序列中一个或多个后续帧。然后为移位后的窗中的每个帧确定个别后验概率参数。该方法精密地逼近更严格的解,但将计算成本节省了两到三个数量级。另外,发明了一种确定切换状态空间模型中的最佳离散状态序列的方法,该方法在逐帧基础上直接利用观测矢量,并在时间上从左到右操作。

Patent Agency Ranking