-
公开(公告)号:CN117271734A
公开(公告)日:2023-12-22
申请号:CN202311246615.8
申请日:2023-09-25
Applicant: 重庆长安汽车股份有限公司
IPC: G06F16/332 , G06F40/35 , G06N20/00
Abstract: 本发明提出一种基于结构化数据微调预训练语言大模型的方法及系统,涉及语音交互的技术领域,解决了工业领域中的结构化数据的微调需求,导致会话生成难度大的问题,首先设定预训练语言大模型的输入数据和输出数据,其次获取包含输入数据的特征的结构化数据,再对结构化数据进行预处理,得到文本数据,然后基于文本数据,生成包含输出数据的特征的训练语料,并利用训练语料对预训练语言大模型进行微调,得到用于会话生成的微调后预训练语言大模型。本发明满足了对工业领域中的结构化数据的微调需求,通过提高预训练语言大模型的泛化能力,有效降低了会话生成难度。