融入依存关系的神经机器翻译方法

    公开(公告)号:CN109062907A

    公开(公告)日:2018-12-21

    申请号:CN201810785646.3

    申请日:2018-07-17

    Applicant: 苏州大学

    Inventor: 段湘煜 王坤 张民

    CPC classification number: G06F17/289

    Abstract: 本发明涉及一种融入依存关系的神经机器翻译方法,为了得到更加精准的神经翻译模型而设计。本发明融入依存关系的神经机器翻译方法,解析出源端句子的依存树,确定源端句子词与词之间的关联性信息;基于所述依存关系信息,确定依存关联性损失Δdep,进而指导得到句对网络整体损失。本发明在源端添加自注意力机制,并将自注意力机制融入依存指导。

    一种信息判别方法和系统

    公开(公告)号:CN105808722A

    公开(公告)日:2016-07-27

    申请号:CN201610128564.2

    申请日:2016-03-08

    Applicant: 苏州大学

    Abstract: 本发明提供了一种信息判别方法及系统,基于网络爬虫技术,检索并收集传统媒体和社交媒体的热点信息对应的网页信息,并对收集到的网页信息进行处理,得到类别数据标记的、划分有训练集数据和测试集数据的传统媒体和社交媒体数据集合;基于训练集数据进行主题建模获取主题与关键词文档,并建立对应传统媒体数据的主题特征集合和对应社交媒体数据的关键词特征集合;利用主题特征集合和关键词特征集合训练分类器,通过得到的传统媒体分类器和社交媒体分类器对测试集数据进行分类判别,得到能够引发社交媒体报道的传统媒体数据,和/或能够引发传统媒体报道的社交媒体数据。由此采用对多个媒体的监测,能够更全面,更快的分析和预测舆情发展的趋势。

    一种文本翻译方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN111178098B

    公开(公告)日:2023-09-12

    申请号:CN201911411188.8

    申请日:2019-12-31

    Applicant: 苏州大学

    Abstract: 本发明公开了一种文本翻译方法,包括:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本。本发明保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。本发明还公开了一种文本翻译装置、设备及存储介质,具有相应技术效果。

    一种机器翻译文本的译后编辑方法及装置

    公开(公告)号:CN109635269B

    公开(公告)日:2023-06-16

    申请号:CN201910079518.1

    申请日:2019-01-31

    Applicant: 苏州大学

    Abstract: 本发明公开了一种机器翻译文本的译后编辑方法,包括:获取源文本和机器翻译文本;通过自注意力机制提取源文本的第一文本特征,并利用前馈神经网络对第一文本特征进行处理,得到表示源文本的第一向量;通过自注意力机制提取机器翻译文本的第二文本特征,通过对第一向量使用注意力机制优化第二文本特征;利用前馈神经网络对优化后的第二文本特征进行处理,得到表示机器翻译文本的第二向量;根据第一向量和第二向量从左至右逐词生成机器翻译文本的译后编辑文本。该方法能够提高译后编辑的处理效率和准确率,使得处理得到的译后编辑文本的准确性更佳。本发明公开的一种机器翻译文本的译后编辑装置、设备及可读存储介质,也同样具有上述技术效果。

    一种文本翻译方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN111178098A

    公开(公告)日:2020-05-19

    申请号:CN201911411188.8

    申请日:2019-12-31

    Applicant: 苏州大学

    Abstract: 本发明公开了一种文本翻译方法,包括:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本。本发明保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。本发明还公开了一种文本翻译装置、设备及存储介质,具有相应技术效果。

    一种改进训练语料的平行质量的方法及装置

    公开(公告)号:CN105955966B

    公开(公告)日:2019-04-26

    申请号:CN201610235521.4

    申请日:2016-04-15

    Applicant: 苏州大学

    Abstract: 本发明公开了一种改进训练语料的平行质量的方法及装置。该方法包括:在预先获得的训练语料库中确定待纠正的目标句对,目标句对包括原文句子和相对应的译文句子;从目标句对的所有组合划分点中,选择一个可用组合划分点;利用可用组合划分点划分目标句对,获得原文句子的两个子句和译文句子的两个子句;确定获得的子句构成的子句对是否平行及各子句间的非平行关系;根据预设的对应规则,使用与确定的非平行关系对应的纠正方式纠正目标句对。应用本发明实施例所提供的技术方案,改进了训练语料的平行质量,提升了统计机器翻译系统的翻译性能。

    一种机器翻译文本的译后编辑方法及装置

    公开(公告)号:CN109635269A

    公开(公告)日:2019-04-16

    申请号:CN201910079518.1

    申请日:2019-01-31

    Applicant: 苏州大学

    CPC classification number: G06F17/24 G06F17/289

    Abstract: 本发明公开了一种机器翻译文本的译后编辑方法,包括:获取源文本和机器翻译文本;通过自注意力机制提取源文本的第一文本特征,并利用前馈神经网络对第一文本特征进行处理,得到表示源文本的第一向量;通过自注意力机制提取机器翻译文本的第二文本特征,通过对第一向量使用注意力机制优化第二文本特征;利用前馈神经网络对优化后的第二文本特征进行处理,得到表示机器翻译文本的第二向量;根据第一向量和第二向量从左至右逐词生成机器翻译文本的译后编辑文本。该方法能够提高译后编辑的处理效率和准确率,使得处理得到的译后编辑文本的准确性更佳。本发明公开的一种机器翻译文本的译后编辑装置、设备及可读存储介质,也同样具有上述技术效果。

    基于语法规约指导的神经机器翻译方法

    公开(公告)号:CN108984538A

    公开(公告)日:2018-12-11

    申请号:CN201810784072.8

    申请日:2018-07-17

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于语法规约指导的神经机器翻译方法,为了得到更加精准的神经翻译模型而设计。本发明基于语法规约指导的神经机器翻译方法,本发明对源端和目标端都进行指导:在源端,添加了注意力损失来指导注意力集中在源端短语上;在目标端通过一层子网络来指导目标端词关注到合适的目标端短语上。网络的源端和目标端构成一个汇总损失,称为指导损失,用于指导NMT。本发明能够有效地改善神经机器翻译质量。

    一种微博用户交互式性别识别方法及装置

    公开(公告)号:CN104598648A

    公开(公告)日:2015-05-06

    申请号:CN201510087855.7

    申请日:2015-02-26

    Applicant: 苏州大学

    CPC classification number: G06F17/30654 G06F17/30684 G06F17/30705

    Abstract: 本方案公开了一种微博用户交互式性别识别方法及装置。该方法首先获取微博用户的个人资料信息和用户之间的交互微博文本,并利用交互用户个人资料中的性别信息对交互文本的交互式性别类别进行标注;然后利用标注好的用户之间的交互文本作为训练样本,并利用训练样本训练最大熵分类器;最后,对某测试交互用户集进行分类。综合来看,本发明可以利用交互文本对微博中的两个交互用户的交互式性别进行识别,且在训练样本数量有限的情况下,达到较高的准确率。

Patent Agency Ranking