-
公开(公告)号:CN118332086A
公开(公告)日:2024-07-12
申请号:CN202410465219.2
申请日:2024-04-17
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/28
Abstract: 一种基于大语言模型的问答对生成方法和系统,方法包括如下操作步骤:(1)数据预处理;(2)文本切片处理;(3)三元组增强的大语言模型问题生成;(4)基于两阶段检索的大语言模型答案生成;(5)基于大语言模型实现问题改写增强。系统包括如下模块:数据预处理模块、文本切片处理模块、三元组增强的大语言模型问题生成模块、基于两阶段检索的大语言模型答案生成模块和基于大语言模型问题改写增强模块。本发明充分利用了大语言模型强大的语义理解与语言生成能力,能生成电信领域的多样化、准确、符合业务知识且语义通顺的问答对。