Patent search ap:("清华大学") AND inv:"唐玉建" Page 1

1.

发明授权
语种识别系统失效

公开(公告)号：CN108648747B

公开(公告)日：2020-06-02

申请号：CN201810234745.2

申请日：2018-03-21

Applicant: 清华大学

Inventor： 刘巍巍 , 董太清 , 周建华 , 王希光 , 唐玉建 , 吴栋 , 王浩 , 赵鹏 , 刘艺 , 张卫强 , 刘加

IPC: G10L15/02 , G10L15/08

Abstract: 本发明提供了一种语种识别系统，所述识别系统包括：获取模块、超矢量计算模块、分类模块及语种识别模块；通过获取模块获取语种的语音样本，并得到音素序列的概率值和二叉决策树特征超矢量的概率值；再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接，从而得到语音样本的联合特征超矢量；分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模，得到每一语种的联合支持矢量，语种识别模块用于获取输入的待测的语音段，在训练库中匹配联合支持矢量，得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

2.

发明公开
语种识别系统失效

公开(公告)号：CN108648747A

公开(公告)日：2018-10-12

申请号：CN201810234745.2

申请日：2018-03-21

Applicant: 清华大学

Inventor： 刘巍巍 , 董太清 , 周建华 , 王希光 , 唐玉建 , 吴栋 , 王浩 , 赵鹏 , 刘艺 , 张卫强 , 刘加

IPC: G10L15/02 , G10L15/08

Abstract: 本发明提供了一种语种识别系统，所述识别系统包括：获取模块、超矢量计算模块、分类模块及语种识别模块；通过获取模块获取语种的语音样本，并得到音素序列的概率值和二叉决策树特征超矢量的概率值；再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接，从而得到语音样本的联合特征超矢量；分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模，得到每一语种的联合支持矢量，语种识别模块用于获取输入的待测的语音段，在训练库中匹配联合支持矢量，得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

3.

发明公开
语种识别方法及计算机设备失效

公开(公告)号：CN108510977A

公开(公告)日：2018-09-07

申请号：CN201810235261.X

申请日：2018-03-21

Applicant: 清华大学

Inventor： 刘巍巍 , 董太清 , 周建华 , 王希光 , 唐玉建 , 吴栋 , 王浩 , 赵鹏 , 刘艺 , 张卫强 , 刘加

IPC: G10L15/00 , G10L15/02 , G10L15/197

Abstract: 本发明提供了一种语种识别方法及计算机设备，首先获取多个语种的语音样本，通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算，再将所有音素序列的比较计算结果拼接得到每一语音样本的联合特征超矢量；通过分类器将训练库中语种样本的联合特征超矢量进行分类和语种建模，得到每一语种的联合支持矢量，获取输入的待测的语音段并得其联合特征超矢量，在训练库中查询与联合特征超矢量匹配的联合支持矢量，得到与语音段对应的目标语种。本发明使用联合特征超矢量可以使长上下文音素序列更准确的建模，从而可以让一个语音段的特征描述更加精细，提高语种识别性能。

4.

发明授权
语种识别方法及计算机设备失效

公开(公告)号：CN108510977B

公开(公告)日：2020-05-22

申请号：CN201810235261.X

申请日：2018-03-21

Applicant: 清华大学

Inventor： 刘巍巍 , 董太清 , 周建华 , 王希光 , 唐玉建 , 吴栋 , 王浩 , 赵鹏 , 刘艺 , 张卫强 , 刘加

IPC: G10L15/00 , G10L15/02 , G10L15/197

Abstract: 本发明提供了一种语种识别方法及计算机设备，首先获取多个语种的语音样本，通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算，再将所有音素序列的比较计算结果拼接得到每一语音样本的联合特征超矢量；通过分类器将训练库中语种样本的联合特征超矢量进行分类和语种建模，得到每一语种的联合支持矢量，获取输入的待测的语音段并得其联合特征超矢量，在训练库中查询与联合特征超矢量匹配的联合支持矢量，得到与语音段对应的目标语种。本发明使用联合特征超矢量可以使长上下文音素序列更准确的建模，从而可以让一个语音段的特征描述更加精细，提高语种识别性能。

Patent Agency Ranking