-
公开(公告)号:CN118821796A
公开(公告)日:2024-10-22
申请号:CN202410726533.1
申请日:2024-06-06
Applicant: 北京理工大学
IPC: G06F40/58 , G06F16/34 , G06F40/186 , G06F40/216 , G06F40/284 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及一种基于大模型多阶段数据增强的跨语言简讯生成方法,属于计算机自然语言处理技术领域。本方法通过指令微调技术,利用英文原文和中文简讯之间的对应关系,生成适合大模型学习的指令微调语料。本发明将大模型应用于跨语言科技简讯生成领域,以及结合多阶段数据增强框架,提高了模型在特定任务上的表现,同时保持了模型的泛化能力,解决了传统跨语言文本摘要任务样本不足等问题,避免了传统跨语言任务流水线方法中的误差传播,能够更快地进行推理。本方法通过串行结构学习多个相关任务,并通过辅助任务数据进行增强,从共享的知识中受益,提高了性能,增强泛化能力,有效应对数据稀缺性。
-
公开(公告)号:CN118823779A
公开(公告)日:2024-10-22
申请号:CN202410726500.7
申请日:2024-06-06
Applicant: 北京理工大学
IPC: G06V20/70 , G06V10/74 , G06V10/82 , G06F16/332 , G06F16/51 , G06F16/583 , G06F40/58 , G06N3/0455 , G06N3/0895 , G06N3/092
Abstract: 本发明涉及一种基于大语言模型与检索对比的小语种图片描述生成方法,属于图片和自然语言处理技术领域。首先构建大语种到小语种平行语料数据集,以及大语种和小语种图片描述对数据集。然后进行多语理解大语言模型训练。之后进行图像文本对齐,向量数据库检索生成提示。最后根据训练好的模型和生成的提示词生成描述。本方法直接使用大语言模型生成,无需经过翻译步骤,从而提高了生成效率。图片描述生成直接针对小语种展开,通过引入检索对比技术,进一步提升了生成质量和准确率。本方法使得小语种图片描述生成更为可行,为相关领域的研究和应用提供了有力的技术支持。
-