一种电力调度语音识别方法

    公开(公告)号:CN112397054A

    公开(公告)日:2021-02-23

    申请号:CN202011494795.8

    申请日:2020-12-17

    Abstract: 本发明提出一种电力调度语音识别方法,建立声学模型,用于将语音信号转换为音素;建立包括通用发音字典和电力调度领域词发音字典的发音字典;利用生成的类标签语料信息对语言模型进行训练,生产类标签语言模型;将待识别的语音信号进行能量谱的提取,通过26阶梅尔(Mel)滤波器,对对数功率谱进行反离散余弦变换,得到13维的梅尔频率倒谱系数(MFCC)特征;将提取的MFCC特征通过所述声学模型、发音字典、类标签语言模型构成的加权有限状态转换器(WFST)解码网络进行Lattice解码,求出待识别语音信号的文本信息。本发明的方法可以提升模型对电力调度语音的适应性,有效提高电力调度语音识别的准确率。

    一种电力调度语音识别方法

    公开(公告)号:CN112397054B

    公开(公告)日:2023-11-24

    申请号:CN202011494795.8

    申请日:2020-12-17

    Abstract: 本发明提出一种电力调度语音识别方法,建立声学模型,用于将语音信号转换为音素;建立包括通用发音字典和电力调度领域词发音字典的发音字典;利用生成的类标签语料信息对语言模型进行训练,生产类标签语言模型;将待识别的语音信号进行能量谱的提取,通过26阶梅尔(Mel)滤波器,对对数功率谱进行反离散余弦变换,得到13维的梅尔频率倒谱系数(MFCC)特征;将提取的MFCC特征通过所述声学模型、发音字典、类标签语言模型构成的加权有限状态转换器(WFST)解码网络进行Lattice解码,求出待识别语音信号的文本信息。本发明的方法可以提升模型对电力调度语音的适应性,有效提高电力调度语音识别的准确率。

Patent Agency Ranking