一种结构化文本翻译方法及装置

    公开(公告)号:CN110232193A

    公开(公告)日:2019-09-13

    申请号:CN201910349677.9

    申请日:2019-04-28

    Abstract: 本发明实施例提供一种结构化文本翻译方法及装置,包括:将待翻译的目标结构化文本的结构化标记去除,得到目标文本;将所述目标文本输入到训练好的文本翻译神经网络模型中,根据短语搜索空间对所述目标文本的翻译候选词进行搜索翻译,得到目标翻译文本和对齐信息;根据所述对齐信息,对所述目标翻译文本进行结构化标记恢复处理,得到目标结构化翻译文本。本发明实施例通过将结构化文本的结构化标记去除,从而通过基于短语搜索空间的神经网络模型对去除结构化标记的文本进行翻译,并将翻译后的文本恢复结构化标记,得到结构化翻译文本,实现了通过神经网络模型对结构化文本进行翻译。

    机器翻译方法及装置
    32.
    发明公开

    公开(公告)号:CN109446534A

    公开(公告)日:2019-03-08

    申请号:CN201811109824.7

    申请日:2018-09-21

    Abstract: 本发明实施例提供一种机器翻译方法及装置,其中方法包括:将源语句前文的词向量输入至预先训练的上下文编码器,输出所述源语句前文的编码标识;将源语句的词向量以及所述源语句前文的编码标识输入至预先训练的源语言编码器,获得所述源语句的编码标识;将目标语句中已翻译的词向量、源语句前文的编码标识和源语句的编码标识输入至预先训练的解码器,获得目标语句中新翻译的词向量;根据所述目标语句中新翻译的词向量获得对应的翻译结果。本发明实施例能够解决机器翻译对上下文的依赖,显著提高翻译质量。

    一种神经网络中向量相关性计算方法及系统

    公开(公告)号:CN108596337A

    公开(公告)日:2018-09-28

    申请号:CN201810416509.2

    申请日:2018-05-03

    Applicant: 清华大学

    CPC classification number: G06N3/08 G06N3/04

    Abstract: 本发明提供一种神经网络中向量相关性计算方法及系统,所述方法包括:S1,根据目标神经网络的拓扑结构,获取所述目标神经网络中各输入层神经元到所述目标神经网络中各输出层神经元之间的路径;其中,所述输入层神经元用于输入端向量的输入,所述输出层神经元用于输出端向量的输出;S2,计算从各所述输入层神经元到各所述输出层神经元的路径总得分,根据所述路径总得分获取所述输入端向量与所述输出端向量之间的相关性。本发明可以正向传播相关性,并在前向计算中使用得到的相关性,应用范围广。

    双语词典构建方法和设备
    34.
    发明公开

    公开(公告)号:CN107315741A

    公开(公告)日:2017-11-03

    申请号:CN201710374136.2

    申请日:2017-05-24

    Applicant: 清华大学

    Abstract: 本发明提供双语词典构建方法和设备用于解决如何不依赖于种子双语词典的自动构建双语词典的问题。其中双语词典构建方法,包括步骤:S101、输入语言a的单语语料A,和输入语言b的单语语料B,分别将单语语料A和单语语料B中的词表示为词向量;S102、训练获得单语语料A的词向量与单语语料B的词向量的映射关系;S103、根据映射关系构建双语词典。本发明从单语语料上训练得到的单语词向量出发,构建生成器和鉴别器组成的神经网络模型,通过设计合适的损失函数和训练技术,直接得到两种语言词向量之间的映射关系,从而构建双语词典,从而不依赖于种子双语词典即可完成。

    一种基于无监督领域自适应的神经网络机器翻译方法

    公开(公告)号:CN107038159A

    公开(公告)日:2017-08-11

    申请号:CN201710139214.0

    申请日:2017-03-09

    Applicant: 清华大学

    CPC classification number: G06F17/289 G06N3/08

    Abstract: 本发明提供一种基于无监督领域自适应的神经网络机器翻译方法,包括:将双语语料训练样本中源端句最后一个词和第一个词的向量表示作为Softmax分类器和翻译模块的输入进行训练;根据Softmax分类器生成的领域数目,生成翻译网络解码器的数目,基于目标端的解码器生成目标端以及所对应的领域。本发明克服了现有技术中缺乏已标注领域数据的问题,节省时间和成本,能够高效准确地完成翻译和领域之间的自适应,具有较好的实用性,具备良好的适用范围以及可扩展性。

    一种知识图谱表示学习方法

    公开(公告)号:CN105630901A

    公开(公告)日:2016-06-01

    申请号:CN201510961791.9

    申请日:2015-12-21

    Applicant: 清华大学

    CPC classification number: G06F17/30604

    Abstract: 本发明公开了一种知识图谱表示学习方法,该方法包括:利用实体向量与关系向量之间基于平移的模型,定义关系三元组(head,relation,tail)中实体向量与关系向量之间的相互关联;利用神经网络分类模型,定义特性三元组(entity,attribute,value)中实体向量与特性向量之间的相互关联;通过评价函数将实体向量、关系向量和特性向量关联起来,并最小化评价函数,以学习实体向量、关系向量和特性向量,达到优化目标。采用本发明能够精确表示实体、关系和特性之间的联系。

Patent Agency Ranking