基于词对和翻译判断句子是否对齐的方法、装置及设备

    公开(公告)号:CN109325242B

    公开(公告)日:2023-06-13

    申请号:CN201811094517.6

    申请日:2018-09-19

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于词典和翻译判断句子是否对齐的方法,在对源文本句进行分词得到源文本词之后,还确定了与源文本词对应的翻译文本词,并据此更新了源文本词序列,最后根据源文本句以及目标文本句对应的隐藏状态序列,判断源文本句与目标文本句是否对齐。可见,该方法不依赖于源文本句与目标文本句本身去判断二者是否对齐,而是结合源文本句中各个词的翻译,将该翻译的信息融入到了源文本句的抽象表示中,进而根据源文本句与目标文本句的抽象表示来判断二者是否对齐,极大的提高了判断的精准性。此外,本发明还提供了一种基于词典和翻译判断句子是否对齐的装置、设备及计算机可读存储介质,其作用与上述方法相对应。

    基于深度神经网络的句子对齐方法

    公开(公告)号:CN109062910A

    公开(公告)日:2018-12-21

    申请号:CN201810835723.1

    申请日:2018-07-26

    Applicant: 苏州大学

    CPC classification number: G06F17/2827 G06F17/274 G06N3/0454

    Abstract: 一种基于深度神经网络的句子对齐方法,采用双向循环神经网络层,对句子进行编码,不仅考虑了单词本身的语义信息,还考虑了该单词的上下文信息,使每个单词获得包含其上下文信息的隐藏状态;门关联网络层,计算两个句子中词对间的语义关系信息;以双向循环神经网络获得的每个单词的隐藏状态作为输入,使用通过门机制融合的双线性模型和单层神经网络的网络,来从线性关系和非线性关系两个角度捕获词对间相似性,然后使用最大池化操作来捕获其最具信息量的部分;对于互为翻译的两个句子中存在绝大多数互为翻译的单词,传统方法也是利用词对信息进行对齐判断,本发明不需要利用额外的词典信息,来捕获词对间的语义关系特征。并能获得词对相似度矩阵。

    基于词对和翻译判断句子是否对齐的方法、装置及设备

    公开(公告)号:CN109325242A

    公开(公告)日:2019-02-12

    申请号:CN201811094517.6

    申请日:2018-09-19

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于词典和翻译判断句子是否对齐的方法,在对源文本句进行分词得到源文本词之后,还确定了与源文本词对应的翻译文本词,并据此更新了源文本词序列,最后根据源文本句以及目标文本句对应的隐藏状态序列,判断源文本句与目标文本句是否对齐。可见,该方法不依赖于源文本句与目标文本句本身去判断二者是否对齐,而是结合源文本句中各个词的翻译,将该翻译的信息融入到了源文本句的抽象表示中,进而根据源文本句与目标文本句的抽象表示来判断二者是否对齐,极大的提高了判断的精准性。此外,本发明还提供了一种基于词典和翻译判断句子是否对齐的装置、设备及计算机可读存储介质,其作用与上述方法相对应。

    基于深度神经网络的句子对齐方法

    公开(公告)号:CN109062897A

    公开(公告)日:2018-12-21

    申请号:CN201810834431.6

    申请日:2018-07-26

    Applicant: 苏州大学

    CPC classification number: G06F17/271 G06N3/0454

    Abstract: 一种基于深度神经网络的句子对齐方法,语料预处理,生成词表和词嵌入词表,采用双向循环神经网络层,对句子进行编码,不仅考虑单词本身的语义信息,而且考虑该单词的上下文信息,使每个单词获得包含其上下文信息的隐藏状态;将每个句子中单词的隐藏状态求其平均来获得句子向量,再将两个句子向量拼接起来;再通过感知器层获得更抽象的表示,从而判断句子是否对齐。另外,本发明可以通过双向循环神经网络编码后获得的单词隐藏状态不仅包含其自身含义,同时也包含其上下文信息。

Patent Agency Ranking