-
公开(公告)号:CN119476209A
公开(公告)日:2025-02-18
申请号:CN202411543332.4
申请日:2024-10-31
Applicant: 国网山西省电力公司信息通信分公司
IPC: G06F40/16 , G06F16/35 , G06F40/30 , G06F40/284 , G06F40/253 , G06N3/09
Abstract: 本发明提出一种基于最优提示词选择的大语言模型优化生成方法,属于大语言模型优化生成技术领域;所要解决的技术问题为:提供一种基于最优提示词选择的大语言模型优化生成方法的改进;解决该技术问题采用的技术方案为:对选取的数据集进行预处理,通过拼接问题与答案形成序列,采用谱聚类算法划分成多组相似特征的问答对;从各聚类中抽样代表性样本,基于专业知识、语言逻辑和语义关联,构建可以针对特定问题引导生成大模型的优质提示词;使用大参数在线模型,参考已创建的优质提示词,为每个聚类生成多样化且针对性的提示词集合,整合生成的问题、候选提示词及其答案,构建用于微调提示评估模型的数据集;本发明用于生成语言模型。