-
公开(公告)号:CN107808664A
公开(公告)日:2018-03-16
申请号:CN201610773161.3
申请日:2016-08-30
Applicant: 富士通株式会社
CPC classification number: G10L15/16 , G10L15/02 , G10L15/063
Abstract: 本申请实施例提供一种基于稀疏神经网络的语音识别方法、装置和电子设备,该方法包括:对待识别语音片段进行处理,以获得所述待识别语音片段中的每个语音帧的特征向量;采用稀疏神经网络对所述特征向量进行识别,以获得与所述特征向量对应的状态标签值(state id),其中,所述稀疏神经网络的权重矩阵基于维度变换而得到;以及采用解码模型对所述状态标签值进行解码,以得到所述待识别语音片段对应的文本。根据本实施例,语音识别用的稀疏神经网络的规模被缩小,并且,该稀疏神经网络的训练时间较短,训练结果被改善。
-
公开(公告)号:CN107274904A
公开(公告)日:2017-10-20
申请号:CN201610216660.2
申请日:2016-04-07
Applicant: 富士通株式会社
Abstract: 本发明公开了一种说话人识别方法和说话人识别设备。该说话人识别方法包括:从待识别说话人语料中,提取待识别说话人的语音特征;基于所提取的待识别说话人的语音特征、体现语音特征在特征空间中的分布的通用背景模型UBM、体现语音特征在特征空间中的分布的变化的统计值的梯度通用说话人模型GUSM、体现环境变化的总变化矩阵,得到待识别说话人模型;以及比较待识别说话人模型和已知说话人模型,以确定待识别说话人是否为已知说话人之一。
-