语种识别方法及计算机设备

    公开(公告)号:CN108510977B

    公开(公告)日:2020-05-22

    申请号:CN201810235261.X

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别方法及计算机设备,首先获取多个语种的语音样本,通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算,再将所有音素序列的比较计算结果拼接得到每一语音样本的联合特征超矢量;通过分类器将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,获取输入的待测的语音段并得其联合特征超矢量,在训练库中查询与联合特征超矢量匹配的联合支持矢量,得到与语音段对应的目标语种。本发明使用联合特征超矢量可以使长上下文音素序列更准确的建模,从而可以让一个语音段的特征描述更加精细,提高语种识别性能。

    基于基状态矢量加权的短语音说话人识别方法

    公开(公告)号:CN103219008B

    公开(公告)日:2016-04-20

    申请号:CN201310182450.2

    申请日:2013-05-16

    Applicant: 清华大学

    Abstract: 本发明提出一种基于基状态矢量加权的短语音说话人识别方法,包括以下步骤:采集多个带文本标注的语音数据,并对多个语音数据进行训练得到状态层聚类的隐马尔可夫模型;根据状态层聚类的隐马尔可夫模型对说话人识别中的数据进行解码得到数据的基状态标注;根据数据的基状态的标注训练基状态的通用背景模型,并从MAP自适应后的模型生成基状态均值超矢量和基状态权值超矢量;根据基状态均值超矢量和基状态权值超矢量进行说话人模型训练和测试估计短语音说话人的身份。根据本发明实施例的方法,可以实现基状态层的精细建模,并通过有效的加权,克服传统方法易导致的“模型空洞”的问题,从而有效降低了建模的自由度,同时可以提高了说话人识别的性能。

    一种建材散发关键参数的快速测定方法及其测定装置

    公开(公告)号:CN102162812A

    公开(公告)日:2011-08-24

    申请号:CN201010603475.1

    申请日:2010-12-23

    Applicant: 清华大学

    Abstract: 本发明涉及一种建材散发关键参数的快速测定方法及其测定装置,属于室内环境检验领域,该方法包括:建立建材VOC散发过程对测定装置内浓度的影响模型:用控温装置(如恒温水浴)控制测定装置的温度始终保持在设定值;将待测试建材置于测定装置中,密封测定装置;在建材散发过程中,多次测量测定装置内目标VOC的浓度;最后2~3次浓度结果的平均值作为平衡浓度,其余浓度结果作为逐时浓度;并整理成对数的形式,然后对散发时间进行线性拟合,获得斜率和截距,从而获得建材散发过程的三大关键参数-初始浓度、扩散系数和分配系数。本发明的环境舱系统及其测定方法简便、测试时间短,同时具有较高的精度,非常便于工程应用。

    语种识别方法及计算机设备

    公开(公告)号:CN108510977A

    公开(公告)日:2018-09-07

    申请号:CN201810235261.X

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别方法及计算机设备,首先获取多个语种的语音样本,通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算,再将所有音素序列的比较计算结果拼接得到每一语音样本的联合特征超矢量;通过分类器将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,获取输入的待测的语音段并得其联合特征超矢量,在训练库中查询与联合特征超矢量匹配的联合支持矢量,得到与语音段对应的目标语种。本发明使用联合特征超矢量可以使长上下文音素序列更准确的建模,从而可以让一个语音段的特征描述更加精细,提高语种识别性能。

    基于DNN模型和支持向量机模型的说话人个数估计方法

    公开(公告)号:CN106898354A

    公开(公告)日:2017-06-27

    申请号:CN201710123753.5

    申请日:2017-03-03

    Applicant: 清华大学

    Abstract: 本发明提出基于DNN模型和支持向量机模型的说话人个数估计方法,属于语音信号处理和深度学习领域。模型训练阶段,首先获取N个说话人的训练语音数据,得到深度神经网络DNN模型;然后获取M个说话人的训练语音数据,每个说话人的梅尔倒谱特征对应DNN模型的N个输出概率,组成M个说话人的N维特征,建立M个支持向量机SVM模型;说话人个数估计阶段,将每条待测语音数据的梅尔倒谱特征输入DNN模型得到N维特征并依次输入M个SVM模型中评分,得分最高的SVM模型即为该条待测语音数据所对应的类别,类别总个数即为估计的说话人个数。该方法解决多说话人场景中说话人个数计算不准确的问题,提高语音数据中说话人个数估计的准确率。

    一种建材散发关键参数的快速测定方法

    公开(公告)号:CN102162812B

    公开(公告)日:2013-07-24

    申请号:CN201010603475.1

    申请日:2010-12-23

    Applicant: 清华大学

    Abstract: 本发明涉及一种建材散发关键参数的快速测定方法及其测定装置,属于室内环境检验领域,该方法包括:建立建材VOC散发过程对测定装置内浓度的影响模型:用控温装置(如恒温水浴)控制测定装置的温度始终保持在设定值;将待测试建材置于测定装置中,密封测定装置;在建材散发过程中,多次测量测定装置内目标VOC的浓度;最后2~3次浓度结果的平均值作为平衡浓度,其余浓度结果作为逐时浓度;并整理成对数的形式,然后对散发时间进行线性拟合,获得斜率和截距,从而获得建材散发过程的三大关键参数-初始浓度、扩散系数和分配系数。本发明的环境舱系统及其测定方法简便、测试时间短,同时具有较高的精度,非常便于工程应用。

    语种识别系统
    7.
    发明授权

    公开(公告)号:CN108648747B

    公开(公告)日:2020-06-02

    申请号:CN201810234745.2

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别系统,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;通过获取模块获取语种的语音样本,并得到音素序列的概率值和二叉决策树特征超矢量的概率值;再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接,从而得到语音样本的联合特征超矢量;分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,语种识别模块用于获取输入的待测的语音段,在训练库中匹配联合支持矢量,得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

    语种识别系统
    8.
    发明公开

    公开(公告)号:CN108648747A

    公开(公告)日:2018-10-12

    申请号:CN201810234745.2

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别系统,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;通过获取模块获取语种的语音样本,并得到音素序列的概率值和二叉决策树特征超矢量的概率值;再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接,从而得到语音样本的联合特征超矢量;分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,语种识别模块用于获取输入的待测的语音段,在训练库中匹配联合支持矢量,得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

    基于基状态矢量加权的短语音说话人识别方法

    公开(公告)号:CN103219008A

    公开(公告)日:2013-07-24

    申请号:CN201310182450.2

    申请日:2013-05-16

    Applicant: 清华大学

    Abstract: 本发明提出一种基于基状态矢量加权的短语音说话人识别方法,包括以下步骤:采集多个带文本标注的语音数据,并对多个语音数据进行训练得到状态层聚类的隐马尔可夫模型;根据状态层聚类的隐马尔可夫模型对说话人识别中的数据进行解码得到数据的基状态标注;根据数据的基状态的标注训练基状态的通用背景模型,并从MAP自适应后的模型生成基状态均值超矢量和基状态权值超矢量;根据基状态均值超矢量和基状态权值超矢量进行说话人模型训练和测试估计短语音说话人的身份。根据本发明实施例的方法,可以实现基状态层的精细建模,并通过有效的加权,克服传统方法易导致的“模型空洞”的问题,从而有效降低了建模的自由度,同时可以提高了说话人识别的性能。

    一种用于室内物品及材料化学污染物释放测量的检测系统

    公开(公告)号:CN101285811B

    公开(公告)日:2011-09-14

    申请号:CN200810104939.7

    申请日:2008-04-25

    Applicant: 清华大学

    CPC classification number: Y02A50/25

    Abstract: 本发明属于室内环境检验领域,特别涉及用于室内物品材料化学污染的检测系统,包括实验室及设置在该实验室中的封闭检测舱;该检测舱包括检测舱门、设在该检测舱内顶部的搅拌风扇、在该检测舱的顶壁开有的排风口和在该检测舱的侧壁下部开有的送风口;在该实验室内设置有计算机及与其相连的浓度采样仪、压力采样仪、温湿度采样仪和流量采样仪,该实验室内上空还设置有三个管道;第一管道设置有第一套空气处理设备,第二管道中设置有第二套空气处理设备,第三管道内设置有排风扇。本发明采用空气处理设备控制检测舱的环境,使其温度、湿度、背景浓度、颗粒物浓度、混合度和送风量达到标准,提高了室内物品材料化学污染的检测质量,并降低了成本。

Patent Agency Ranking