-
公开(公告)号:CN115660000A
公开(公告)日:2023-01-31
申请号:CN202210780981.0
申请日:2022-07-04
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/58 , G06F40/284 , G06F18/24 , G06N3/096 , G06N20/00
Abstract: 本发明公开了一种中医药垂直领域中英机器翻译方法,包括以下步骤:1.中医药平行语料库建设;2.利用迁移学习的方式搭建神经机器翻译模型;3.中医药领域术语库加工;4.远程监督知识库构建;5.综合利用。本发明与现有技术相比的优点在于:更好的利用了迁移学习的策略,并优化了模型参数和改进了模型结构,使其在充分继承原预训练模型优点和海量参数的同时极大的改进了模型训练的精度和效率,形成了具有中医药语言学特色的中英领域翻译模型,利用了远程监督的方式,把高质量中医药中英平行语料资源、专业中英术语词汇资源、正异名资源进行整合为知识库,仅通过知识库就可以译出目标语言,并且准确率极高,同时对正异名词汇也有很好的合并功能。