-
公开(公告)号:CN119990280A
公开(公告)日:2025-05-13
申请号:CN202510125434.2
申请日:2025-01-26
Applicant: 浙江大学 , 支付宝(杭州)信息技术有限公司
IPC: G06N5/022 , G06F40/289 , G06N3/045 , G06N3/0895 , G06F40/30 , G06F40/186
Abstract: 本说明书的一个或多个实施例涉及一种模型知识编辑方法、装置、计算设备和计算机程序产品。该方法包括基于第一提示词,获取模型的第一输出结果,第一提示词与模型的本体知识库中的领域分支概念相关联。该方法还包括基于第二提示词,获取模型的第二输出结果,第二提示词基于第一提示词和与领域分支概念相关联的本体知识而生成。该方法还包括确定第一输出结果和第二输出结果不一致。此外,该方法还包括至少基于第一提示词和第二输出结果训练模型。
-
公开(公告)号:CN119739728A
公开(公告)日:2025-04-01
申请号:CN202411595541.3
申请日:2024-11-08
Applicant: 支付宝(杭州)信息技术有限公司 , 浙江大学
IPC: G06F16/242 , G06F16/2453 , G06F16/2455
Abstract: 本说明书提供一种结构化查询语句的生成方法和系统,包括:基于结构化查询语句生成模型,将自然语言查询语句拆解为若干个自然语言查询子句,并基于结构化查询语句生成模型,将若干个自然语言查询子句生成为结构化查询语句。其中,结构化查询语句生成模型为基于第一大模型蒸馏得到的第二大模型,该第二大模型的参数比所述第一大模型少。通过将经知识蒸馏技术的小模型应用于生成方法中,使得小模型在保持较高性能的同时,参数量显著减少,从而可以提高生成效率,且减少对计算资源的占用。另外,通过将复杂的自然语言查询语句拆解为一个或多个简单的自然语言查询子句,可以更容易地理解和处理查询意图,从而提高生成的准确性和可靠性。
-
公开(公告)号:CN119128086A
公开(公告)日:2024-12-13
申请号:CN202411175813.4
申请日:2024-08-23
Applicant: 浙江大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F18/214
Abstract: 本说明书提供了一种医疗LLM模型微调方法及相关设备。该方法包括:获取与目标应用场景相关的数据集;所述数据集包括单轮问答样本,所述单轮问答样本包含问题文本和与所述问题文本对应的回答文本;获取基于与所述目标应用场景相关的多轮对话任务的任务需求,构建的与所述多轮对话任务对应的多轮对话规则,并将所述单轮问答样本转换为符合所述多轮对话规则的多轮对话样本;基于所述多轮对话样本对预训练完成的LLM基础模型进一步执行微调训练,得到基于所述多轮对话规则执行所述多轮对话任务的LLM服务模型。
-
公开(公告)号:CN118940845A
公开(公告)日:2024-11-12
申请号:CN202411419984.7
申请日:2024-10-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/04 , G06N5/022 , G06F16/335 , G06F16/36 , G06F18/25
Abstract: 本说明书提供一种知识查询推理方法及装置、知识库系统,方法包括根据用户查询短语对知识图谱上的关联节点进行检索,并在根据关联节点未检索到查询结果的情况下,从知识图谱中获取与关联节点对应的文本信息,文本信息用于描述节点对应的事实知识,根据文本信息以及用户查询短语调用大语言模型生成查询结果。通过知识图谱中结构化知识与文本知识的融合表示,可以避免知识图谱过渡结构化带来的维度灾难和难以维护问题,降低成本和图谱复杂性,文本知识可以弥补结构化知识的上下文信息缺失问题;而且知识图谱中文本知识也可以弥补大语言模型的事实知识缺失问题,实现大语言模型与知识图谱性能的双向增强。
-
-
-