基于激励CTC及子词解码的海南方言语音识别方法

    公开(公告)号:CN119252231A

    公开(公告)日:2025-01-03

    申请号:CN202411660670.6

    申请日:2024-11-20

    Abstract: 本发明公开了一种基于激励CTC及子词解码的海南方言语音识别方法,属于语音识别技术领域,包括以下步骤:获取海南方言语音信号,将海南方言语音信号进行处理提取声学特征;获取文本数据,将文本数据进行处理提取语言特征;构建语音识别模型,语音识别模型包含声学模型、RNN语言模型、改进CTC损失函数以及解码器,在训练过程中,基于改进CTC损失函数对声学模型、RNN语言模型进行参数优化,最终得到训练后的语音识别模型;引入子词模型,构建TSLG解码图,基于TSLG解码图采用训练后的语音识别模型进行海南方言识别,得到海南方言识别结果;通过该方法,能够得到准确的语音识别结果。

    一种海南方言语音识别系统及装置

    公开(公告)号:CN117577094A

    公开(公告)日:2024-02-20

    申请号:CN202311428936.X

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种海南方言语音识别系统,包括特征提取模块和音素识别模块;特征提取模块通过对原始海南方言语音提取出各种语音特征,音素识别模块将所述语音特征依次通过卷积神经网络、残差网络、多头注意力机制以及长短期记忆网络组合而成的声学模型得到发音底层特征,通过全连接层映射到合适的维度,生成音素串;经过CTC损失函数计算预测的音素串与真实的音素串的差值,通过Ad‑am算法对模型中的参数进行优化,得到音素错误率;根据发音底层特征,利用海南方言发音底层特征进行方言语音识别。本发明能够有效提取不同方言特有的音素串发音底层特征,同时多种语音特征的融入使得方言语音识别性能得到大幅度提升。

    一种临高话和普通话混合语音识别模型训练方法及系统

    公开(公告)号:CN117373438A

    公开(公告)日:2024-01-09

    申请号:CN202311428942.5

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种临高话和普通话混合语音识别模型训练方法,基于Conformer模型构建的端到端混合语音识别模型,所述方法包括:输入包含临高话和普通话的混合语音信号,并提取混合语音信号的声学特征序列;将特征序列输入到预设编码器,进行降采样以减少特征冗余信息,再经编码器编码生成隐藏向量;解码器对向量进行解码,在解码图中,依据转移弧上的权重逐帧进行搜索,计算每条路径中的权重得分;选择得分最高的路径作为最优路径,不断更新状态信息;输出最优路径对应的标签序列作为最终识别结果。本发明增强了模型提取局部细微特征的能力,提升了模型的语言建模能力,提高了模型识别的准确率。

    一种基于预训练和微调的方言语音识别方法及系统

    公开(公告)号:CN118298814A

    公开(公告)日:2024-07-05

    申请号:CN202410481956.1

    申请日:2024-04-22

    Abstract: 本发明公开了一种基于预训练和微调的方言语音识别方法及系统,涉及语音识别技术领域,包括获取待识别语音数据,根据待识别语音数据,获取待识别语音标识信息,根据语音识别数据集,获取方言语音识别模型,根据待识别语音标识信息,基于方言语音识别模型,获取语音识别信息。本发明通过待识别语音标识信息,提高了语音识别的准确度,通过音频数据质量指数,提高了数据的准确性和可靠性,为语音识别模型提供数据基础,通过数据集标准片段信息,对现有的语音识别模型进行训练,获取方言语音识别模型,根据语音匹配指数,对语音识别可能信息进行筛选,获取语音识别模糊修正信息,提高了模型的泛化能力和语音识别的准确性。

Patent Agency Ranking