Patent search ap:("清华大学") AND inv:"梁天宇" Page 1

1.

发明公开
一种基于深度混合模型的说话人确认方法有权

公开(公告)号：CN108694950A

公开(公告)日：2018-10-23

申请号：CN201810465602.2

申请日：2018-05-16

Applicant: 清华大学

Inventor： 何亮 , 陈仙红 , 徐灿 , 梁天宇 , 刘加

IPC: G10L17/04 , G10L17/02 , G10L25/24

CPC classification number: G10L17/04 , G10L17/02 , G10L25/24

Abstract: 本发明提出一种基于深度混合模型的说话人确认方法，属于声纹识别、模式识别与机器学习技术领域。该方法首先获取目标说话人的训练语音数据并进行预处理，得到训练语音数据的梅尔倒谱特征集；对梅尔倒谱特征集建立第0层高斯混合模型并求导，得到一阶导数集；然后依次建立第一层高斯混合模型、第二层高斯混合模型，直至建立建立第S层高斯混合模型，将所有高斯混合模型组合得到说话人的深度混合模型；然后获取测试语音数据并提取梅尔倒谱特征集，建立测试语音数据的深度混合模型；计算两个模型的相似度：若相似度小于等于阈值，则测试语音数据属于目标说话人。本发明不仅考虑数据自身分布，还考虑数据的导数分布，提升说话人确认的准确性。

2.

发明授权
一种基于深度混合模型的说话人确认方法有权

公开(公告)号：CN108694950B

公开(公告)日：2021-10-01

申请号：CN201810465602.2

申请日：2018-05-16

Applicant: 清华大学

Inventor： 何亮 , 陈仙红 , 徐灿 , 梁天宇 , 刘加

IPC: G10L17/04 , G10L17/02 , G10L25/24

Abstract: 本发明提出一种基于深度混合模型的说话人确认方法，属于声纹识别、模式识别与机器学习技术领域。该方法首先获取目标说话人的训练语音数据并进行预处理，得到训练语音数据的梅尔倒谱特征集；对梅尔倒谱特征集建立第0层高斯混合模型并求导，得到一阶导数集；然后依次建立第一层高斯混合模型、第二层高斯混合模型，直至建立建立第S层高斯混合模型，将所有高斯混合模型组合得到说话人的深度混合模型；然后获取测试语音数据并提取梅尔倒谱特征集，建立测试语音数据的深度混合模型；计算两个模型的相似度：若相似度小于等于阈值，则测试语音数据属于目标说话人。本发明不仅考虑数据自身分布，还考虑数据的导数分布，提升说话人确认的准确性。

Patent Agency Ranking