一种双语无监督句法分析方法及系统

    公开(公告)号:CN104281564B

    公开(公告)日:2017-08-08

    申请号:CN201410394850.4

    申请日:2014-08-12

    Inventor: 刘凯 姜文斌 刘群

    Abstract: 本发明公开了一种双语无监督句法分析方法及系统,该方法包括以下步骤:步骤1,在双语语料源端和目标端分别建立随机句法分析树库;步骤2,在该随机句法分析树库上通过计算单语无监督句法分析树的概率来单独训练单语无监督句法分析模型;步骤3,通过计算松弛同构相似度和双语句法分析算法对该单语无监督句法分析模型进行双语句法分析,得到最为满足松弛同构双语句法分析目标的双语句法分析树库,并用以替换该随机句法分析树库;步骤4,重复上述步骤1‑步骤3,直至该单语无监督句法分析模型收敛。由此,获得更好的单语无监督句法分析模型,以用于所有需要句法分析的下游应用中。

    一种双语无监督句法分析方法及系统

    公开(公告)号:CN104281564A

    公开(公告)日:2015-01-14

    申请号:CN201410394850.4

    申请日:2014-08-12

    Inventor: 刘凯 姜文斌 刘群

    Abstract: 本发明公开了一种双语无监督句法分析方法及系统,该方法包括以下步骤:步骤1,在双语语料源端和目标端分别建立随机句法分析树库;步骤2,在该随机句法分析树库上通过计算单语无监督句法分析树的概率来单独训练单语无监督句法分析模型;步骤3,通过计算松弛同构相似度和双语句法分析算法对该单语无监督句法分析模型进行双语句法分析,得到最为满足松弛同构双语句法分析目标的双语句法分析树库,并用以替换该随机句法分析树库;步骤4,重复上述步骤1-步骤3,直至该单语无监督句法分析模型收敛。由此,获得更好的单语无监督句法分析模型,以用于所有需要句法分析的下游应用中。

    多语机器翻译智能辅助处理方法和系统

    公开(公告)号:CN102968411B

    公开(公告)日:2015-12-16

    申请号:CN201210410530.4

    申请日:2012-10-24

    Abstract: 本发明公开的一种多语机器翻译智能辅助处理方法和系统。其方法包括如下步骤:根据源语言和已翻译目标语言获取源语言已翻译的区间,对源语言未翻译的区间进行扩展;根据源语言未翻译的区间扩展,生成K-best提示集;并根据源语言未翻译的区间和已翻译目标语言生成输入历史提示集和语言模型提示集;结合输入历史提示集、语言模型提示集、以及K-best提示集,生成所述源语言未翻译源区间对应的目标语言的候选集。其加快多语翻译的速度,用户体验好,智能化程度高,提高了翻译准确度。

    多语机器翻译智能辅助处理方法和系统

    公开(公告)号:CN102968411A

    公开(公告)日:2013-03-13

    申请号:CN201210410530.4

    申请日:2012-10-24

    Abstract: 本发明公开的一种多语机器翻译智能辅助处理方法和系统。其方法包括如下步骤:根据源语言和已翻译目标语言获取源语言已翻译的区间,对源语言未翻译的区间进行扩展;根据源语言未翻译的区间扩展,生成K-best提示集;并根据源语言未翻译的区间和已翻译目标语言生成输入历史提示集和语言模型提示集;结合输入历史提示集、语言模型提示集、以及K-best提示集,生成所述源语言未翻译源区间对应的目标语言的候选集。其加快多语翻译的速度,用户体验好,智能化程度高,提高了翻译准确度。

    一种基于依存句法树的翻译规则抽取方法和翻译方法

    公开(公告)号:CN102799578A

    公开(公告)日:2012-11-28

    申请号:CN201210227973.X

    申请日:2012-07-02

    Inventor: 谢军 米海涛 刘群

    Abstract: 本发明提供基于依存句法树的翻译规则抽取方法及翻译方法,将翻译调序关系直接表示于源端为中心词及其所有修饰成分组成的依存句法树片段、目标端为串的翻译规则中,从而使翻译规则可以明确地指导翻译过程。通过这种方法抽取的翻译规则,可以提高了基于依存句法树的翻译方法的性能。在154万平行双语语料数据集上,本发明的依存句法树到串翻译模型的性能较成分树到串模型提高1.68个BLEU点。

    统计机器解码特征权重的训练方法和解码方法

    公开(公告)号:CN101989260A

    公开(公告)日:2011-03-23

    申请号:CN200910164808.2

    申请日:2009-08-01

    Abstract: 本发明提供一种统计机器解码方法,包括下列步骤:1)对于测试集的每个源语言句子,由单解码器生成测试集句子的翻译超图;2)将所述测试集句子的翻译超图压缩为测试集句子的共享压缩翻译超图;3)在所述测试集句子的共享压缩翻译超图上,进行联合解码,从所述联合解码所获得的多个最优译文中选择最终译文。根据上述方法进行统计机器解码,缓解了单解码器和系统融合的局限性,并且提高了译文翻译的准确性。

    基于树到树翻译模型的翻译规则抽取方法和翻译方法

    公开(公告)号:CN101989257A

    公开(公告)日:2011-03-23

    申请号:CN200910090202.9

    申请日:2009-07-31

    Abstract: 本发明提供一种基于树到树翻译模型的翻译规则抽取方法,包括下列步骤:1)、分析训练语料中的源语言串和目标语言串并输出训练语料的源语言压缩共享句法森林和训练语料的目标语言压缩共享句法森林;2)、根据所述训练语料的源语言压缩共享句法森林和所述训练语料的目标语言压缩共享句法森林抽取翻译规则。根据该翻译规则进行测试语料的翻译,有效提高了翻译质量。

    一种目标场所优化调度方法及系统

    公开(公告)号:CN100595121C

    公开(公告)日:2010-03-24

    申请号:CN200710179079.9

    申请日:2007-12-10

    Abstract: 本发明公开了一种目标场所优化调度方法及系统。该方法包括下列步骤:采集目标场所相应目标对应的正例样本集合和反例样本集合;在正例样本集合和反例样本集合中,提取图像特征并进行训练,得到用于目标场所目标检测的分类器;从获取的目标场所的实时视频图像中,利用分类器检测出目标,对目标场所进行优化调度。将从目标场所获取的实时视频图像检测出的目标所在区域作为正例样本,重复训练,进一步提高分类器的分类精确度。其对目标场所进行优化调度,提高目标场所的工作效率。

    一种机器翻译自动评测方法及其系统

    公开(公告)号:CN100555270C

    公开(公告)日:2009-10-28

    申请号:CN200410000628.8

    申请日:2004-01-13

    Inventor: 刘群 刘洋

    Abstract: 本发明公开了一种机器翻译自动评测方法及其系统。该方法在至少一篇参考译文中查找机器翻译系统的输出译文的匹配子片断,然后根据这些匹配子片断及其长度计算熵,以及计算长度惩罚系数和匹配比例惩罚系数,最后获得一个评分作为评价指标。本发明的机器翻译自动评测系统包括子片断搜索模块、长度计算模块、长度惩罚模块、匹配比例惩罚模块和评测得分计算模块。本发明的机器翻译自动评测方法及其系统可以准确评价译文质量,并且能够成生一个具有绝对意义的评价指标,而且在进行自动评测时不限制匹配子片断的长度。

    基于线性模型的汉语词法分析方法

    公开(公告)号:CN101295295A

    公开(公告)日:2008-10-29

    申请号:CN200810114950.1

    申请日:2008-06-13

    Abstract: 本发明提供一种基于线性模型的汉语词法分析方法,包括如下步骤:1)输入汉语语句,设定分析窗口长度;2)对语句进行逐字分析,对语句中的每一个字,将该字时间窗口内的字或字元组输入感知机分类器,得出当前字标注为某一分词标注和词性标注的感知机模型得分;同时,将该字时间窗口内的字或字元组输入线性词法分析模型,得出当前字标注为某一分词标注和词性标注的线性词法分析模型得分;3)感知机模型得分和线性词法分析模型得分加权求和得出综合分析得分,将综合分析得分最高的分词标注和词性标注做为当前字的分词标注和词性标注;当所有字的分词标注和词性标注均标注完成时,所述汉语语句的词法分析完毕。本发明能够显著地提高了切分和标注的精确度。

Patent Agency Ranking