-
公开(公告)号:CN118036747A
公开(公告)日:2024-05-14
申请号:CN202410177829.2
申请日:2024-02-08
Applicant: 南京大学
Abstract: 本发明公开一种能提升数值处理能力的中文金融大语言模型构建方法,包括金融语料数据集构建阶段,基于低秩适配的增量预训练阶段,基于低秩适配的对数值敏感的选项微调阶段,低秩适配模块的混合与合并阶段,以及利用训练后的中文金融大语言模型进行推理阶段;提高了模型在中文金融问答任务上进行推理时的预测准确率,提高了在包含数值变量的问题上的准确率,也提高了在不包含数值变量的问题上的准确率。