-
公开(公告)号:CN119646130A
公开(公告)日:2025-03-18
申请号:CN202411524678.X
申请日:2024-10-30
Applicant: 中关村融智企业管理创新推广中心 , 北京大船科技有限公司
IPC: G06F16/3329 , G06F16/334 , G06N5/04 , G06F16/36 , G06N5/025
Abstract: 本发明属于机器学习技术领域,具体涉及一种基于知识增强大模型的问答系统设计方法,包括以下步骤:S1:领域内文本数据采集;S2:数据预处理;S3:构建知识图谱;S4:知识图谱增强大语言模型框架设计;S5:问答系统构建;采用该设计方法,我们得到一种基于知识增强大模型的问答系统,包括:数据采集模块,数据预处理模块、知识图谱构建模块、数据库、大语言模型层、展示层和前端UI,对于使用者,不需要了解复杂的架构,只需要输入想问的问题,系统便输出经知识图谱增强的大语言模型的回答。本发明通过知识图谱对大语言模型的知识增强,借助该大语言模型问答链可减少幻觉问题,提高回答领域内问题时的规范性与准确性。
-
公开(公告)号:CN119514678A
公开(公告)日:2025-02-25
申请号:CN202411524822.X
申请日:2024-10-30
Applicant: 中关村融智企业管理创新推广中心 , 北京大船科技有限公司
IPC: G06N5/04 , G06N5/022 , G06F18/214 , G06N3/045 , G06N3/08 , G06F40/205 , G06F40/289
Abstract: 本发明属于计算机科学技术领域,具体涉及一种基于思维链的网络安全知识推理方法,所述方法包括以下步骤:S1:筛选网络安全学术资料,将筛选得到的资料进行统一格式化处理,得到用于大模型预训练的网络安全数据语料;S2:进行网络安全语料训练;利用PEFT技术与FlashAttention2技术对基础大模型进行网络安全语料训练;S3:利用当前的思维链提示理论知识进行思维链提示样例设计;S4:思维链提示方法的设计。本发明能够在结合了现有大模型的基础上,将思维链的零样本推理与少样本推理方法相结合,训练精调一个性能较为优秀的网络安全大模型。
-