Patent search ap:("度小满科技(北京)有限公司") AND inv:"梁宇颢" Page 1

1.

发明公开
语音识别方法、装置、存储介质及电子设备审中-实审

公开(公告)号：CN119600994A

公开(公告)日：2025-03-11

申请号：CN202411575360.4

申请日：2024-11-06

Applicant: 度小满科技(北京)有限公司

Inventor： 梁宇颢 , 单长浩 , 孙思宁

IPC: G10L15/06 , G10L15/02 , G10L15/08 , G10L15/26 , G06F18/23213

Abstract: 本发明提供一种语音识别方法、装置、存储介质及电子设备，该方法包括：调用目标预训练模型，对目标语音数据进行特征提取，得到目标语音数据中每个目标语音帧的语音特征；基于每个目标语音帧的语音特征，对目标语音数据进行聚类处理，得到多个聚类语音特征，以确定至少一个文本识别结果；当目标语音数据满足流式音频数据识别条件时，基于多个聚类语音特征和至少一个文本识别结果，确定目标语音数据下的音频数据表示特征；调用目标注意力模型，基于目标语音数据下的音频数据表示特征，确定至少一个文本识别结果中每个文本识别结果的解码特征，从而确定目标语音数据的目标语音识别结果。本发明实施例可快速地对目标语音数据进行语音识别。

Patent Agency Ranking