-
公开(公告)号:CN117217312B
公开(公告)日:2025-02-28
申请号:CN202311085481.6
申请日:2023-08-25
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N5/022 , G06N3/04 , G06F16/28 , G06F16/901
Abstract: 本发明提供一种基于图神经网络的可解释知识图谱推理方法及装置,该基于图神经网络的可解释知识图谱推理方法包括:获取用户输入的待查询三元组,待查询三元组包括源实体和实体关系;根据源实体在知识图谱中的上下文信息构建知识图谱子图,并根据关系感知的注意力机制对知识图谱子图和实体关系进行编码,得到关系权重;基于关系权重对源实体在知识图谱中关联的关系路径进行聚合处理,得到关系路径表征。本发明所述方法通过结合结构信息、实体关系对不同实体的贡献度,以及其在各种规则路径中的重要性对源实体的关系路径进行综合分析,充分利用知识图谱的上下文信息和周围邻居节点信息,提升了推理结果的准确率。
-
公开(公告)号:CN119443166A
公开(公告)日:2025-02-14
申请号:CN202411626024.8
申请日:2024-11-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出了提升小型语言模型复杂推理的神经符号协同蒸馏方法,包括:首先,从大型语言模型中提取一般推理能力和通用知识,将其蒸馏至参数化的SLMs中;其次,针对复杂推理任务所需的特定能力和罕见知识,采用符号知识蒸馏手段,将这些知识存储在符号知识库中。通过这种一般能力与特定能力的解耦,能够以较小的模型规模和成本实现高性能。此外,本发明还包含一种多任务学习方法,通过引入辅助任务如增强蒸馏、答案预测和直接推理提示,进一步提升SLMs对可能噪声知识的鲁棒性,并有效利用特定知识。本发明增强了小型语言模型处理复杂推理任务的能力,适用于对一般认知能力及专业领域知识都有需求的复杂推理场景。
-
公开(公告)号:CN119415223A
公开(公告)日:2025-02-11
申请号:CN202411278711.5
申请日:2024-09-12
Applicant: 中国科学院自动化研究所 , 昆明理工大学
Abstract: 本发明提供一种任务性能控制方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:基于因果追踪方法确定目标模型在执行上下文学习任务中的重点输入词;确定所述目标模型在执行推理过程中在所述重点输入词上的梯度变化;将梯度变化最大的预设数量的位置上的神经元确定为重点神经元;通过调整所述重点神经元的激活水平控制所述目标模型的任务性能。
-
公开(公告)号:CN118193750B
公开(公告)日:2024-12-27
申请号:CN202410312411.8
申请日:2024-03-19
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06N5/02 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06F17/16 , G06F17/18 , G06F18/22 , G06N3/08
Abstract: 本发明提供一种知识图谱事实错误检测方法、装置、电子设备及存储介质,应用于数据处理技术领域。该方法包括:从待检测知识图谱中获取目标三元组,所述目标三元组包括头实体、尾实体以及实体关联关系;确定所述目标三元组的置信度分数,所述置信度分数包括局部分数和全局分数,所述局部分数用于指示所述目标三元组的内部结构的矛盾程度,所述全局分数用于指示所述头实体和所述尾实体在所述待检测知识图谱中的外部语义的差异程度;在所述置信度分数大于预设阈值的情况下,确定所述目标三元组存在事实错误。
-
公开(公告)号:CN119168055A
公开(公告)日:2024-12-20
申请号:CN202411051838.3
申请日:2024-08-01
Applicant: 中国科学院自动化研究所 , 上海人工智能创新中心
IPC: G06N5/04 , G06N5/045 , G06N5/022 , G06F16/9032
Abstract: 本发明提供一种基于知识库与语言模型的问答方法及装置,该方法包括:将目标问题输入至知识生成模型中输出至少一维目标知识信息;将根据目标问题和各维目标知识信息获取的目标输入信息输入至问答模型中,得到目标问题对应的答案预测信息;知识生成模型是基于知识库中的第一知识元组生成的第一候选问题、根据第一候选问题以及知识库中的第二知识元组生成的第二候选问题、根据第一知识元组转换的第一样本知识信息和通过大型语言模型对第二候选问题进行提示信息学习得到的第二样本知识信息,对小型语言模型进行训练的。本发明融合知识库与语言模型训练出可生成高质量知识信息,且小尺寸的知识生成模型,以便捷、高效地预测出高精度的答案。
-
公开(公告)号:CN116595131B
公开(公告)日:2024-12-06
申请号:CN202310295002.7
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G16H80/00 , G06F18/214
Abstract: 本发明提供一种使用大型语言模型进行医疗问答的方法及系统,该方法包括:获取用户的医疗对话历史内容;将所述医疗对话历史内容和第一提示指令输入大型语言模型,基于所述大型语言模型的多样化采样解码得到多个第一响应;将所述医疗对话历史内容和多个第二提示指令输入所述大型语言模型,得到分别对应于每个所述第二提示指令的多个第二响应;将所述医疗对话历史内容、所述多个第一响应和所述多个第二响应输入所述大型语言模型,生成医疗对话的回复内容并发送给所述用户。使得大型语言模型能够利用整体性思维,提高思维的深度和广度,从而能够生成更准确的回复内容,提升用户的使用体验。
-
公开(公告)号:CN118690381A
公开(公告)日:2024-09-24
申请号:CN202410626469.X
申请日:2024-05-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种面向数据权限管理的大语言模型训练方法及装置,所述方法包括:基于各领域数据,分别对预训练大语言模型进行训练,得到各领域的微调模块参数,并将各领域的微调模块参数存储至指定内存;基于目标用户对各领域数据的访问权限,从指定内存加载与访问权限对应目标领域的微调模块参数;将各目标领域的微调模块参数与预训练大语言模型的模型参数合并,得到目标用户对应领域的目标模型。本发明不仅能够获得性能较好的目标模型,而且能够降低模型训练和存储的成本。
-
公开(公告)号:CN118377870A
公开(公告)日:2024-07-23
申请号:CN202410423509.0
申请日:2024-04-09
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F18/22 , G06F18/214
Abstract: 本发明提供一种基于大语言模型指导的无监督对话检索器的训练方法,方法包括:获取样本对话查询数据,以及初始对话检索器;基于初始对话检索器,生成样本对话查询数据的回复参考文档;基于大语言模型,确定样本对话查询数据与回复参考文档之间的相关性结果;基于相关性结果,指导初始对话检索器进行参数迭代,直至得到最终的对话检索器。本发明提供的方法,借助于大语言模型零样本泛化能力,将大语言模型的知识理解能力应用到得到样本对话数据与回复参考文档之间的相关性结果的任务上,提升了初始检索器的训练效率。并且,可以使得对话检索器具备大语言模型强大的对话理解能力,同时也提升了对话检索器的对话理解能力和检索性能。
-
公开(公告)号:CN116578714A
公开(公告)日:2023-08-11
申请号:CN202310294052.3
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种知识图谱上的树状规则提取方法及装置,所述方法包括:从知识图谱上提取链式规则;对所述链式规则进行前向推理,得到对目标规则体变量的预测结果;基于所述预测结果进行反向推理,得到所述目标规则体变量表示;基于所述目标规则体变量表示将候选原子补充到目标规则体变量处,得到树状规则。本发明提供的知识图谱上的树状规则提取方法及装置,基于链式规则,补充候选原子,得到树状规则,提升了规则的表达能力,使得规则更加准确,具有更好的链接预测效果。
-
公开(公告)号:CN111061851B
公开(公告)日:2023-08-08
申请号:CN201911276552.4
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06N5/022
Abstract: 本发明涉及一种基于给定事实的问句生成方法及系统所述问句生成方法包括:获取历史参考数据,所述历史参考数据包括多条不同用户的历史输入信息;对各历史输入信息进行扩展,得到对应的上下文表示;根据各所述输入信息及对应的上下文表示,建立问句生成模型;基于所述问句生成模型,根据当前用户的当前输入信息,确定所述当前输入信息对应的问句序列。本发明通过历史参考数据建立问句生成模型;能够基于所述问句生成模型,可根据当前用户给定的少量当前输入信息,即可准确确定所述当前输入信息对应的问句序列。
-
-
-
-
-
-
-
-
-