-
公开(公告)号:CN119378574A
公开(公告)日:2025-01-28
申请号:CN202411408324.9
申请日:2024-10-10
Applicant: 哈尔滨工业大学
Abstract: 一种基于情感增强的语音大语言模型翻译强化方法,涉及人工智能领域。解决现有技术中缺少如何高效地将语音模态信息融入到现有的大语言模型中,使其完成端到端的语音自动翻译任务。所述方法包括:收集包含多种情感表达的语音与文本对的多语言数据集,并进行预处理,构成原文语音与文本和译文语音与文本的多语言语料对;将多语言语料对的语音部分输入到语音大语言模型中,令语音大语言模型对其进行翻译;使用情感契合度打分模型对步骤2中的翻译结果进行评估,判断翻译结果中的语音情感与原文语音与文本的多语言语料对中的情感是否一致;使用打分模型为同一问题的不同结果进行打分,根据分数从高到低排序进行DPO算法,更新语音大语言模型的参数。
-
公开(公告)号:CN117610584A
公开(公告)日:2024-02-27
申请号:CN202311726909.0
申请日:2023-12-15
Applicant: 哈尔滨工业大学 , 无锡睿文科技有限公司
IPC: G06F40/51 , G06F18/25 , G06F40/186
Abstract: 一种基于大语言模型的翻译质量评估评分融合方法及装置,涉及人工智能技术领域。为解决现有技术中存在的,基于大语言模型的翻译质量评估评分融合效果不理想的问题,本发明提供的技术方案为:一种基于大语言模型的翻译质量评估评分融合方法,包括:获取需要进行融合的评分的步骤;选取最大的预设个评分与最小的预设个评分作为融合使用的步骤;将所述融合使用的评分代入到预设提示模板中的步骤;将加入评分的所述预设提示模板送入预设模型,获得答案的步骤。定义需要进行融合的评分个数为n,最大的评分有和最小的评分分别有n/4个。在所述n/4不整除时,商向上取整。适合应用于大语言模型的翻译质量评估工作中。
-
公开(公告)号:CN117350306A
公开(公告)日:2024-01-05
申请号:CN202311229851.9
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F40/51 , G06F40/58 , G06N3/0455 , G06N3/088 , G06N3/09 , G06N3/0895 , G06N3/0442
Abstract: 一种基于预训练模型注意力机制的无监督词汇级翻译质量评估方法和系统,涉及词汇级翻译质量评估领域。解决了现有技术对于汇级别对于标注数据的依赖性强的问题。所述方法包括:S1:部署两个多语言预训练模型XLM‑RoBERTa和XLM‑Align,并无需追加训练;S2:获取两个预训练模型的Transformer层的自注意力矩阵;S3:根据所述预训练模型的Transformer层的自注意力矩阵进行逐次分析待评估词汇与其余词汇的注意力权值,将注意力权值作为词汇级翻译的质量评估的评分。本发明应用于人工智能领域。
-
公开(公告)号:CN117556834A
公开(公告)日:2024-02-13
申请号:CN202311338861.6
申请日:2023-10-16
Applicant: 哈尔滨工业大学
Abstract: 一种基于上下文期望的无监督词汇级翻译质量评估方法和系统,涉及无监督词汇级翻译质量评估领域。解决现有词汇级别QE需要依赖大规模的标注数据,且机器翻译质量评估不准确的问题。所述方法包括:将待评估语句输入至多语言模型中,对所述多语言模型译文端的某一词汇进行遮盖;将所述待评估语句的上下文信息和被遮掩的译文输入至多语言模型,根据所述多语言模型预测被遮掩的词;利用条件概率处理被遮掩词中每个子词间的关系,获取每个子词的生成概率;根据所述生成概率作为评分进行词汇级机器翻译质量评估。本发明应用于机器翻译领域。
-
-
-