-
公开(公告)号:CN104699675B
公开(公告)日:2018-01-30
申请号:CN201510119654.0
申请日:2015-03-18
Applicant: 北京交通大学
IPC: G06F17/28
Abstract: 本发明公开了一种翻译信息的方法和装置,属于自然语言处理研究领域。方法包括:获取源语言格式的第一信息中包含的表情符号;在第一信息中将该表情符号置换为用于标识该表情符号的第一标识得到第二信息;将第二信息翻译为目标语言格式的第三信息;从第三信息中提取与第一标识相对应的第二标识;在第三信息中将第二标识置换为第二标识对应的表情符号得到第四信息。装置包括:第一获取模块,第一置换模块,翻译模块,第一提取模块和第二置换模块。实现了不受表情符号库及翻译词典的限制,对表情符号的高精度翻译,降低构筑包含表情符号的翻译词典、翻译规则、翻译模型和语言模型等成本,解决表情符号词典内未登录的表情符号的识别、翻译和生成问题。
-
公开(公告)号:CN114154520B
公开(公告)日:2024-10-15
申请号:CN202111389048.2
申请日:2021-11-22
Applicant: 北京交通大学
IPC: G06F40/58 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本申请公开了一种机器翻译模型的训练方法、机器翻译方法、装置及设备,属于计算机技术领域,该方法包括:获取训练样本集,训练样本集包括训练样本及该训练样本对应的标准翻译文本;将训练样本及训练样本对应的标准翻译文本输入机器翻译模型中,获取机器翻译模型在反向传播过程中产生的梯度向量;基于梯度向量和多个噪音词为训练样本生成对抗样本;基于训练样本和对抗样本对机器翻译模型进行对抗训练,得到目标机器翻译模型。该训练方法生成的对抗样本对机器翻译模型攻击性较大,并且增加了训练数据的多样性,由此提高了机器翻译模型的鲁棒性,进而提高了机器翻译模型的翻译性能,使得通过机器翻译模型得到的翻译结果更加准确。
-
公开(公告)号:CN118734863A
公开(公告)日:2024-10-01
申请号:CN202310379093.2
申请日:2023-03-31
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/40 , G06F16/36 , G06F16/33 , G06F40/284 , G06N3/0499 , G06N3/08
Abstract: 本申请提供了一种对话翻译方法、装置、电子设备、计算机可读存储介质及计算机程序产品;涉及人工智能技术;方法包括:获取当前对话的第一对话原文,并获取当前对话的至少一种类型的知识;基于第一对话原文以及至少一种类型的知识进行图构建处理,得到当前对话的图结构;对当前对话的图结构进行图编码处理,得到当前对话的知识图表示;对当前对话的知识图表示进行情感预测处理,得到当前对话的预测情感;基于当前对话的知识图表示以及当前对话的预测情感进行翻译处理,得到当前对话的第一对话译文。通过本申请,能够准确地在对话译文中表达情感,从而提高对话翻译的准确性。
-
公开(公告)号:CN112347795B
公开(公告)日:2024-07-02
申请号:CN202011066983.0
申请日:2020-10-04
Applicant: 北京交通大学
Abstract: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。
-
公开(公告)号:CN113821616B
公开(公告)日:2023-11-14
申请号:CN202110910430.7
申请日:2021-08-09
Applicant: 北京交通大学
IPC: G06F16/332 , G06F16/33
Abstract: 本申请公开了一种领域自适应的槽位填充方法、装置、设备及存储介质,属于自然语言处理领域。该方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼接为用户输入句对;调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息;根据所述答案位置信息,将所述问句的答案作为槽位实体,填充在所述目标槽位中。本申请将槽位填充问题转化为机器阅读理解问题,利用通用机器阅读理解模型对不同领域的语料都具有较好理解能力的特性,可以实现跨领域的槽位填充能力。
-
公开(公告)号:CN116663575A
公开(公告)日:2023-08-29
申请号:CN202210141490.1
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F40/44 , G06F40/211 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种视频对话的翻译方法、装置、设备、存储介质及程序产品;方法包括:获取视频的对话文本,从对话文本中获取待翻译语句;从视频中提取与待翻译语句同步的图像;对图像和待翻译语句进行第一编码处理,得到与待翻译语句对应的多模态上下文,其中,多模态上下文包括待翻译语句中的每个词分别对应的多模态词向量;基于多模态上下文进行解码处理,得到待翻译语句中每个词的翻译结果;其中,待翻译语句中的后序词是根据前序词的翻译结果、以及多模态上下文中后序词对应的多模态词向量进行解码处理得到。通过本申请能够有效提高视频对话翻译的准确性。
-
公开(公告)号:CN116663574A
公开(公告)日:2023-08-29
申请号:CN202210141138.8
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F40/205 , G06F40/284 , G06V20/50 , G06V10/40 , G06V10/80
Abstract: 本申请提供一种多模态对话翻译方法、装置、电子设备及存储介质,涉及计算机技术领域。在基于源语言获取到待翻译对话文本和历史对话文本后,可以确定待翻译对话文本和历史对话文本之间的上下文关系,以及发言对象的对话表达特征,并分别对待翻译对话文本对应的至少一个场景图像进行特征提取,得到相应的图像特征集合,将上下文关系、对话表达特征和图像特征集合进行融合,得到多模态对话特征,并基于目标语言对多模态对话特征进行翻译,获得目标翻译对话文本。由于引入了相应的场景图像,并从场景图像中提取出有效的图像信息,从而可以得到更加准确的目标翻译文本,且得到的目标翻译文本能更好地切合当前的对话场景。
-
公开(公告)号:CN116663571A
公开(公告)日:2023-08-29
申请号:CN202210142644.9
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例提供了一种翻译方法、装置、电子设备以及计算机可读存储介质,涉及人工智能、自然语言处理、多媒体及云技术领域。该方法包括:获取源语言的待翻译文本,通过训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;该翻译模型是通过以下方式训练得到的:获取包括源语言的第一文本和第一文本对应于目标语言的第二文本的多个训练样本;根据每个样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定每个样本对应的训练损失权重;基于多个样本及其对应的训练损失权重对初始神经网络模型进行迭代训练得到翻译模型。基于该方法,能够有效提升翻译效果。
-
公开(公告)号:CN112347795A
公开(公告)日:2021-02-09
申请号:CN202011066983.0
申请日:2020-10-04
Applicant: 北京交通大学
Abstract: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。
-
公开(公告)号:CN111444338A
公开(公告)日:2020-07-24
申请号:CN202010129518.0
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/126 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种文本处理、装置、存储介质及设备,属于人工智能技术领域。方法包括:获取待处理文本,对待处理文本执行向量化处理得到共享特征向量;分别对共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的第二编码处理和与方面级别情感分类任务对应的第三编码处理,依次得到第一特征向量、第二特征向量和第三特征向量;基于第一特征向量、第二特征向量和第三特征向量执行信息传递处理,信息传递处理是指在任意上述两两任务间进行双向特征信息传递;基于信息传递处理后得到的特征向量,对待处理文本进行方面词抽取和方面级别的情感极性分类。本申请显著提升了情感分析效果。
-
-
-
-
-
-
-
-
-