一种基于语法树剪枝的翻译机测试方法

    公开(公告)号:CN114239546A

    公开(公告)日:2022-03-25

    申请号:CN202111471991.8

    申请日:2021-11-30

    Applicant: 南京大学

    Abstract: 本发明涉及一种机器翻译测试方法。该方法对语句构建依存语法树,按特定规则对语法树剪枝,基于一组依存语法树级别的删除运算符来破坏句子的有效性,从原始句子中删除单词或短语来生成新的语法和语义有效的句子,然后将原文和新生成的句子输入被测试的机器翻译系统,通过计算词袋距离,按照词袋距离大小排序扩增句子,选择距离最大的5个句子,通过手动为原句和翻译句子结果贴标签,标记出错的句子,完成对机器翻译系统的测试。本发明目的在于解决目前机器翻译测试主要通过替换句子中的部分单词来生成测试用例,测试性能主要受到所采用的语言模型的成熟度的限制。在数据扩增的同时,保证了句子的基本结构的不变性,从而发现了较多对错误,这些错误很多是过去机器翻译测试技术发现不了的。

Patent Agency Ranking