一种语音关键词识别方法、装置及相关设备

    公开(公告)号:CN116564279A

    公开(公告)日:2023-08-08

    申请号:CN202310612970.6

    申请日:2023-05-26

    Abstract: 本申请公开了一种语音关键词识别方法、装置及相关设备,该方法包括:提取待识别语音的梅尔频率倒谱系数MFCC特征,并将所述MFCC特征输入关键词模型,得到所述待识别语音的识别结果,所述识别结果包括所述待识别语音中包含的各关键词以及每一关键词在所述待识别语音中的定位信息;其中,所述关键词模型包括预设的自注意力网络,所述关键词模型为利用增强后的小语种语音样本对所述自注意力网络进行训练而得到的。经过对有限的小语种语音样本的增强处理,实现了小语种语音样本在多个维度下的扩充,减少了标注成本的同时,缩短了获取足够多小语种语音样本的时间,以便于快速开发相应语音关键音识别应用。

Patent Agency Ranking