-
公开(公告)号:CN114048758B
公开(公告)日:2025-04-15
申请号:CN202111328003.4
申请日:2021-11-10
Applicant: 北京有竹居网络技术有限公司 , 中国科学院计算技术研究所
IPC: G06F40/42 , G06F40/58 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本公开提供了一种用于语音翻译模型的训练方法、语音翻译方法、设备和计算机可读介质。训练方法包括:获得与源语音数据对应的源语音表示序列和与该源语音数据对应的源文本表示序列;根据源语音表示序列和源文本表示序列,获得混合序列;利用语音翻译模型对源语音表示序列进行处理以输出第一目标文本的第一概率分布,并利用语音翻译模型对混合序列进行处理以输出第二目标文本的第二概率分布;根据第一概率分布和第二概率分布,计算总损失函数;和根据总损失函数训练语音翻译模型。
-
公开(公告)号:CN114048758A
公开(公告)日:2022-02-15
申请号:CN202111328003.4
申请日:2021-11-10
Applicant: 北京有竹居网络技术有限公司 , 中国科学院计算技术研究所
Abstract: 本公开提供了一种用于语音翻译模型的训练方法、语音翻译方法、设备和计算机可读介质。训练方法包括:获得与源语音数据对应的源语音表示序列和与该源语音数据对应的源文本表示序列;根据源语音表示序列和源文本表示序列,获得混合序列;利用语音翻译模型对源语音表示序列进行处理以输出第一目标文本的第一概率分布,并利用语音翻译模型对混合序列进行处理以输出第二目标文本的第二概率分布;根据第一概率分布和第二概率分布,计算总损失函数;和根据总损失函数训练语音翻译模型。
-