-
公开(公告)号:CN106469139A
公开(公告)日:2017-03-01
申请号:CN201610895706.8
申请日:2016-10-14
Applicant: 厦门大学
IPC: G06F17/22
CPC classification number: G06F17/2223
Abstract: 基于字形相似度的Unicode传统蒙文规范化方法,涉及文本规范化、传统蒙文编码等领域。通过遍历输入的Unicode编码的传统蒙文文本中的每个词语,将Unicode传统蒙文同形词表收录的词语均替换为其所在等价类的规范编码形式,得到规范化的传统蒙文文本。能有效对Unicode编码的传统蒙文同形词进行规范化,降低统计语言模型在传统蒙文中的数据稀疏性。利用Unicode编码的传统蒙文语料库统计Unicode传统蒙文词汇表,对词汇表中的各个词语依据Unicode传统蒙文同形字母表和图像匹配算法生成同形词,通过归并等价类得到同形词表。Unicode传统蒙文同形字母表包括22条同形替换规则。
-
公开(公告)号:CN104834633A
公开(公告)日:2015-08-12
申请号:CN201510288779.6
申请日:2015-05-29
Applicant: 厦门大学
IPC: G06F17/28
Abstract: 一种云翻译输入法及系统,涉及云计算、机器翻译、计算机辅助翻译、概率词典和输入法等领域。所述云翻译输入法通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,提高了翻译用户输入译文的效率,且支持任何语言的输入。所述云翻译输入系统采用基于云服务的架构实现,设有客户端和服务器端;客户端设有控制模块和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。
-