-
公开(公告)号:CN120068892A
公开(公告)日:2025-05-30
申请号:CN202510107860.3
申请日:2025-01-23
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于提示优化的大语言模型机器翻译强化方法,属于机器翻译强化技术领域。解决了现有技术中传统的针对大语言模型的微调方法因难以提升模型性能导致模型翻译结果不准确的问题;本发明通过提示解码器对提示解码器进行预训练和微调,得到预训练和微调后的提示解码器,构建基于提示解码器的大语言模型;引入SVD‑LoRA方法,对基于提示解码器的大语言模型进行端到端训练,得到训练后的大语言模型;基于外部知识库,构建优化后的的机器翻译的提示,将优化后的的机器翻译的提示输入到训练后的大语言模型,得到目标端语句。本发明提升了大语言模型翻译性能,能够自动优化提示并缩短输入提示长度,可以应用于对大语言模型进行微调。
-
公开(公告)号:CN120068893A
公开(公告)日:2025-05-30
申请号:CN202510107862.2
申请日:2025-01-23
Applicant: 哈尔滨工业大学
IPC: G06F40/58 , G06F40/242 , G06N3/045 , G06N3/0475 , G06N3/088 , G06N3/092 , G06N3/094 , G06N5/04
Abstract: 本发明公开了一种基于双语词典注入的机器翻译强化方法,属于机器翻译强化技术领域。解决了现有技术中传统的机器翻译强化方法针对专有领域翻译的模型性能较差的问题;本发明对大规模无监督单语语料进行双语对齐,生成双语词典;对双语词典引入平行语料,统计双语词典中各个词对在平行语料中的命中率,建立Memory Bank并记录命中率,根据命中率进行词对重要性排序,得到排序后的双语词典;通过Memory Bank对排序后的双语词典中的源端数据进行数据增强,并输入到深度对抗网络模型进行模型训练,得到训练完的深度对抗网络模型。本发明有效实现了对平行语料进行数据增强并提升机器翻译系统生成质量,可以应用于机器翻译建模。
-
公开(公告)号:CN120067241A
公开(公告)日:2025-05-30
申请号:CN202510107858.6
申请日:2025-01-23
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/3329 , G06F16/355 , G06F16/36 , G06N3/045 , G06N3/084 , G06N3/09 , G06N5/04
Abstract: 本发明公开了一种基于样例反馈的大语言模型自动提示优化方法,属于大语言模型提示优化技术领域。解决了现有技术中传统的提示优化方法难以实现自动化调优的问题;本发明构建基于大语言模型的提示优化模块,输入预处理后的输入数据,对其进行基于样例反馈的提示优化,得到修改后的提示;构建基于大语言模型的提示精简模块,对修改后的提示中的超长提示进行精简和改写,得到更新后的提示,传输至提示优化模块进行迭代,得到优化后的提示;构建基于大语言模型的局部搜索模块,对优化后的提示进行局部搜索与调优,得到最优提示。本发明有效提升了针对提示优化的大语言模型的性能,可以应用于采用大语言模型进行自动提示优化。
-
-