-
公开(公告)号:CN114267333A
公开(公告)日:2022-04-01
申请号:CN202111509949.0
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G10L15/00 , G10L15/06 , G06F40/126 , G06F40/242
Abstract: 本发明公开了一种混合双语语音识别方法及系统,所述方法包括如下步骤:数据处理步骤,包括:对一定量的目标双语音频数据和目标双语文本语料执行BPE共享词典制作、数据增广和特征提取操作,为后端网络训练提供有效数据输入;Encoder‑Decoder训练步骤,包括:对所述数据处理步骤获得的有效数据采用Transformer结构训练语音识别器。本发明涉及双语混合连续语音识别技术领域。根据输入的目标语种的单语语音数据、双语混合语音数据或者双语混杂语音数据,自动转写出语音的内容信息。