-
公开(公告)号:CN119600994A
公开(公告)日:2025-03-11
申请号:CN202411575360.4
申请日:2024-11-06
Applicant: 度小满科技(北京)有限公司
IPC: G10L15/06 , G10L15/02 , G10L15/08 , G10L15/26 , G06F18/23213
Abstract: 本发明提供一种语音识别方法、装置、存储介质及电子设备,该方法包括:调用目标预训练模型,对目标语音数据进行特征提取,得到目标语音数据中每个目标语音帧的语音特征;基于每个目标语音帧的语音特征,对目标语音数据进行聚类处理,得到多个聚类语音特征,以确定至少一个文本识别结果;当目标语音数据满足流式音频数据识别条件时,基于多个聚类语音特征和至少一个文本识别结果,确定目标语音数据下的音频数据表示特征;调用目标注意力模型,基于目标语音数据下的音频数据表示特征,确定至少一个文本识别结果中每个文本识别结果的解码特征,从而确定目标语音数据的目标语音识别结果。本发明实施例可快速地对目标语音数据进行语音识别。