-
公开(公告)号:CN113836946B
公开(公告)日:2023-11-14
申请号:CN202111069233.3
申请日:2021-09-13
Applicant: 北京交通大学 , 东芝(中国)有限公司
Abstract: 本申请公开了一种训练评分模型的方法、装置、终端及存储介质,属于互联网技术领域。该方法包括:获取样本原文、第一样本译文以及至少一个第二样本译文,其中,第一样本译文的语义和样本原文对应的语义相同,第二样本译文的语义与第一样本译文的语义不同;将样本原文和第一样本译文输入评分模型,得到第一样本译文对应的第一样本分数,将样本原文分别和每个第二样本译文输入评分模型,得到每个第二样本译文对应的第二样本分数;基于第一样本分数以及至少一个第二样本分数,确定损失信息;基于损失信息,对评分模型进行调整。可见,本申请实施例解决了在没有样本译文对应的基准分数下,无法对评分模型进行训练的问题。
-
公开(公告)号:CN113836946A
公开(公告)日:2021-12-24
申请号:CN202111069233.3
申请日:2021-09-13
Applicant: 北京交通大学 , 东芝(中国)有限公司
Abstract: 本申请公开了一种训练评分模型的方法、装置、终端及存储介质,属于互联网技术领域。该方法包括:获取样本原文、第一样本译文以及至少一个第二样本译文,其中,第一样本译文的语义和样本原文对应的语义相同,第二样本译文的语义与第一样本译文的语义不同;将样本原文和第一样本译文输入评分模型,得到第一样本译文对应的第一样本分数,将样本原文分别和每个第二样本译文输入评分模型,得到每个第二样本译文对应的第二样本分数;基于第一样本分数以及至少一个第二样本分数,确定损失信息;基于损失信息,对评分模型进行调整。可见,本申请实施例解决了在没有样本译文对应的基准分数下,无法对评分模型进行训练的问题。
-
公开(公告)号:CN112347795B
公开(公告)日:2024-07-02
申请号:CN202011066983.0
申请日:2020-10-04
Applicant: 北京交通大学
Abstract: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。
-
公开(公告)号:CN112347795A
公开(公告)日:2021-02-09
申请号:CN202011066983.0
申请日:2020-10-04
Applicant: 北京交通大学
Abstract: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。
-
-
-