Patent search ap:("北京工业大学") AND inv:"罗德雨" Page 1

1.

发明授权
一种基于CTC多层损失的语音识别方法有权

公开(公告)号：CN115019782B

公开(公告)日：2024-07-16

申请号：CN202210619908.5

申请日：2022-06-02

Applicant: 北京工业大学

Inventor： 陈仙红 , 罗德雨 , 鲍长春

IPC: G10L15/06 , G10L15/16 , G10L15/28 , G10L15/01

Abstract: 一种基于CTC多层损失的语音识别方法，属于模式识别、声学领域。该方法对语音识别网络不同层的输出进行规范，使不同层的输出尽量接近所需要的语音识别结果，从而提高语音识别的性能。该方法包括模型训练与模型测试两个阶段：在训练阶段，将预处理后的训练集输入所搭建的多层语音识别网络中，计算不同层的损失和不同层的权重，将不同层损失加权求和得到多层损失，循环计算损失，更新网络参数直至收敛；在测试阶段，将预处理后的测试集输入训练好的多层语音识别网络，输出识别结果。本发明仅仅改变CTC语音识别模型训练阶段的损失函数，并不改变CTC语音识别模型的结构及其语音识别的过程，以低复杂度、低开销的特点提高语音识别的准确率。

2.

发明公开
一种基于CTC多层损失的语音识别方法有权

公开(公告)号：CN115019782A

公开(公告)日：2022-09-06

申请号：CN202210619908.5

申请日：2022-06-02

Applicant: 北京工业大学

Inventor： 陈仙红 , 罗德雨 , 鲍长春

IPC: G10L15/06 , G10L15/16 , G10L15/28 , G10L15/01

Abstract: 一种基于CTC多层损失的语音识别方法，属于模式识别、声学领域。该方法对语音识别网络不同层的输出进行规范，使不同层的输出尽量接近所需要的语音识别结果，从而提高语音识别的性能。该方法包括模型训练与模型测试两个阶段：在训练阶段，将预处理后的训练集输入所搭建的多层语音识别网络中，计算不同层的损失和不同层的权重，将不同层损失加权求和得到多层损失，循环计算损失，更新网络参数直至收敛；在测试阶段，将预处理后的测试集输入训练好的多层语音识别网络，输出识别结果。本发明仅仅改变CTC语音识别模型训练阶段的损失函数，并不改变CTC语音识别模型的结构及其语音识别的过程，以低复杂度、低开销的特点提高语音识别的准确率。

Patent Agency Ranking