-
公开(公告)号:CN115455993A
公开(公告)日:2022-12-09
申请号:CN202210950390.3
申请日:2022-08-09
Applicant: 中国科学院计算技术研究所
IPC: G06F40/58 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种利用条件变分自动编码器进行标签平滑的翻译方法和系统,包括:将翻译训练文本输入具有条件变分自动编码器的神经网络翻译模型,经过该神经网络翻译模型的编解码器,得到解码器的输出向量,将该输出向量输入该条件变分自动编码器,计算出隐变量,并利用隐变量重构出输出向量,最后用该输出向量替换原有的输出向量,预测标签概率分布。在训练阶段,对比该标签概率分布和原输出向量得出的概率分布构成翻译损失;对比条件变分自动编码器的先验后验输出构成自编码器损失。这两种损失函数加上原有输出向量和后验输出向量分别计算出的标签概率分布损失,一同构成该神经网络翻译模型的训练目标;以神经网络翻译模型执行翻译。