一种单通道语音识别方法、设备及存储介质

    公开(公告)号:CN119007709A

    公开(公告)日:2024-11-22

    申请号:CN202411323079.1

    申请日:2024-09-23

    Abstract: 本发明提供一种单通道语音识别方法、设备及存储介质,涉及语音识别技术领域,所述方法包括:获取语音数据;对语音数据进行分割处理,获取多个语音片段数据;对多个语音片段数据进行特征提取处理,获取声学稳健特征信息;将声学稳健特征信息输入至预设的处理模型进行处理,获取人声片段嵌入向量;根据各个人声片段嵌入向量,获取身份标识信息以及对应的语音起止时间信息;根据身份标识信息、语音起止时间信息以及语音片段数据,获取语音识别结果信息。分割处理获取语音片段数据,便于并行处理提高处理效率,处理模型由模型加速处理后获得,简化处理过程提高处理速度并且维持模型性能水平,降低对硬件性能的要求,满足语音识别的准确率和效率要求。

Patent Agency Ranking