一种语音识别方法、装置、设备及可读存储介质

    公开(公告)号:CN116312480A

    公开(公告)日:2023-06-23

    申请号:CN202310126931.5

    申请日:2023-02-10

    Abstract: 本说明书公开了一种语音识别方法、装置、设备及可读存储介质,响应于流式语音识别请求,根据预设的时长,将连续接收的所述待识别音频数据,划分为待识别语音块,将各待识别语音块依次输入预训练的语音识别模型,通过特征提取子网得到第一语音特征,将该待识别语音块的第一语音特征和指定语音块的第一语音特征输入到特征编码子网,通过注意力编码层得到第一注意力得分和第二注意力得分,进而确定出该待识别语音块的第二语音特征,将第二语音特征输入解码器,确定该待识别语音块的预测文本。可见,通过特征编码子网中的注意力编码层确定第一注意力得分和第二注意力得分的方式,能够有效利用声学上下文的信息,提高文本预测的准确性。

Patent Agency Ranking