-
公开(公告)号:CN118551009A
公开(公告)日:2024-08-27
申请号:CN202410626490.X
申请日:2024-05-20
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G06N3/045 , G06N3/0499 , G06N3/0985
Abstract: 本发明提供一种基于想象增强的问答交互模型训练、问答交互方法及装置,所述方法包括:基于检索文本的压缩文本,对大语言模型进行微调,并基于微调后的大语言模型生成问题文本对应的虚拟文本,检索文本是问题文本的增强文本;将问题文本以及虚拟文本输入至学生模型,得到学生模型输出的问题文本的学生答案文本,学生模型的注意力层中添加有适配器,适配器的权重是将问题文本输入至元学习网络后确定的;基于学生答案文本与教师答案文本之间的差异,对学生模型进行蒸馏训练,得到问答交互模型;教师文本是将问题文本输入至学生模型对应的教师模型后生成的。本发明训练得到的问答交互模型能够高效且准确进行问答交互。
-
公开(公告)号:CN117313738A
公开(公告)日:2023-12-29
申请号:CN202311094760.9
申请日:2023-08-28
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F16/33 , G06N3/0499 , G06N3/08
Abstract: 本发明提供一种端到端概念体系构建方法及系统,方法包括:将待构建概念集合包括的第一词语对中的任一词语添加到初始概念体系中,所述第一词语对为从所述待构建概念集合包括的词语对之间上下位关系所对应的第一概率分布中,得到的概率最大的词语对;执行至少一次第一处理过程,直至所述待构建概念集合为空为止,根据更新后的初始概念体系,获取所述待构建概念集合对应的概念体系。所述系统执行所述方法。本发明基于词语对之间上下位关系的概率分布,每次选择概率最大的特定词语对添加到概念体系中,构建待构建概念集合的概念体系,能够更为准确的表征待构建概念集合中词语之间的语义特征。
-
公开(公告)号:CN115618011A
公开(公告)日:2023-01-17
申请号:CN202211193891.8
申请日:2022-09-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06F16/332 , G06N5/02 , G06N3/042 , G06N3/048
Abstract: 本发明提供一种知识问答方法、装置、电子设备和可读存储介质,涉及计算机技术领域,该方法包括:基于获取到的逻辑查询语句构建计算图,并获取计算图中每一个节点的预测节点表示;计算图包括多个节点的节点信息以及相邻节点之间的关联关系,节点信息包括节点深度;针对计算图中的每一个节点,基于节点的前驱节点和后继节点的节点表示对节点的预测节点表示进行校准,得到节点的校准节点表示;基于计算图中节点的校准节点表示以及预设知识图谱中每一个实体的实体表示确定目标实体,并将目标实体作为逻辑查询语句的答案输出,解决了现有技术中如何更好地从知识图谱中检测出逻辑查询语句的答案的技术问题。
-
公开(公告)号:CN115309858A
公开(公告)日:2022-11-08
申请号:CN202210754115.4
申请日:2022-06-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06F40/216 , G06F40/237 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种算术表达式的生成方法、装置、设备、介质及产品,该方法包括:获取目标问题对应的表格和文本;表格和文本用于确定目标问题的算术表达式;基于表格、文本和目标问题,确定目标问题的异质图;基于图处理模型,确定异质图的目标嵌入矩阵;通过树解码器,对目标嵌入矩阵和预设符号字典进行处理,得到目标问题的算术表达式。本发明提供的算术表达式的生成方法、装置、设备、介质及产品用于提高算术表达式的准确率。
-
公开(公告)号:CN105528349B
公开(公告)日:2019-02-01
申请号:CN201410513189.4
申请日:2014-09-29
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06F16/332
Abstract: 本发明实施例提供一种知识库中问句解析的方法,包括:接收用户输入的问句;对问句进行短语检测确定候选短语;将候选短语映射到知识库中的资源项;进一步确定观察谓词的值和可能的问句分析空间。对可能的问句分析空间中的每一个命题集合,根据观察谓词和隐含谓词的值进行不确定性推理计算置信度,并获取置信度满足预设条件的命题集合中的真命题的组合;根据所述真命题的组合,生成形式化查询语句。本发明实施例利用观察谓词和隐含谓词,进行不确定性推理,能够将自然语言问句转化为形式化查询语句。并且,不确定性推理的方法能够应用于任何领域的知识库,具有领域扩展性,这样无需针对知识库人工地配置转换规则。
-
公开(公告)号:CN116521834B
公开(公告)日:2025-03-25
申请号:CN202310303093.4
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06F16/3329 , G06F16/334
Abstract: 本申请提供一种文本答案的推理方法、装置及存储介质,所述方法包括:输入第一文本到语言模型,获取所述语言模型输出的多个候选答案;所述第一文本为待识别的文本;以每一候选答案作为条件确定每一候选答案对应的验证分数;所述验证分数表示候选答案的置信度;输出最高验证分数对应的候选答案作为所述第一文本的推理答案。本申请提供的文本答案的推理方法、装置及存储介质,将语言模型生成的答案替换原始条件后,再次输入到语言模型中,从而验证答案。通过这种自我验证的方法,提高了语言模型输出结果的鲁棒性和准确性。
-
公开(公告)号:CN116992004B
公开(公告)日:2024-12-06
申请号:CN202311069119.X
申请日:2023-08-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06N3/08
Abstract: 本发明提供一种基于统一查询编码器的知识图谱复杂问答方法及装置,其中方法包括:获取查询图的全局特征表示;全局特征表示用于反映查询图的头实体和头实体之间的关系类型的特征信息;将全局特征表示和实体表示输入至神经链接预测器中,由神经链接预测器得到并输出预测尾实体;神经链接预测器是基于知识图谱补全任务训练得到的;实体表示是基于神经链接预测器预先确定的。本发明提供的方法及装置,通过端到端的方法将复杂查询编码为与简单查询相同的形式,从而能够充分利用神经链接预测器,该查询过程可以视为端到端地从神经链接预测器中直接检索答案,因此能够避免逐步计算所有中间节点所产生的错误累积,提高知识问答的成功率以及准确度。
-
公开(公告)号:CN118982003A
公开(公告)日:2024-11-19
申请号:CN202410994182.2
申请日:2024-07-23
Applicant: 中国科学院自动化研究所
Abstract: 提供一种文本数据处理方法和文本数据处理装置。所述文本数据处理方法包括:获取文本数据,并将文本数据输入到通过将语言模型与编译型神经网络融合而生成的文本数据处理模型,其中,语言模型被预先训练,并且编译型神经网络在没有被预先训练的情况下根据要执行的规则密集型任务被分配相应的神经网络权重;基于文本数据处理模型中的语言模型从文本数据确定与文本数据对应的文本数据处理任务;以及响应于文本数据处理任务指示规则密集型任务,基于文本数据处理模型中的编译型神经网络执行规则密集型任务。
-
公开(公告)号:CN118193750A
公开(公告)日:2024-06-14
申请号:CN202410312411.8
申请日:2024-03-19
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06N5/02 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06F17/16 , G06F17/18 , G06F18/22 , G06N3/08
Abstract: 本发明提供一种知识图谱事实错误检测方法、装置、电子设备及存储介质,应用于数据处理技术领域。该方法包括:从待检测知识图谱中获取目标三元组,所述目标三元组包括头实体、尾实体以及实体关联关系;确定所述目标三元组的置信度分数,所述置信度分数包括局部分数和全局分数,所述局部分数用于指示所述目标三元组的内部结构的矛盾程度,所述全局分数用于指示所述头实体和所述尾实体在所述待检测知识图谱中的外部语义的差异程度;在所述置信度分数大于预设阈值的情况下,确定所述目标三元组存在事实错误。
-
公开(公告)号:CN117217312A
公开(公告)日:2023-12-12
申请号:CN202311085481.6
申请日:2023-08-25
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N5/022 , G06N3/04 , G06F16/28 , G06F16/901
Abstract: 本发明提供一种基于图神经网络的可解释知识图谱推理方法及装置,该基于图神经网络的可解释知识图谱推理方法包括:获取用户输入的待查询三元组,待查询三元组包括源实体和实体关系;根据源实体在知识图谱中的上下文信息构建知识图谱子图,并根据关系感知的注意力机制对知识图谱子图和实体关系进行编码,得到关系权重;基于关系权重对源实体在知识图谱中关联的关系路径进行聚合处理,得到关系路径表征。本发明所述方法通过结合结构信息、实体关系对不同实体的贡献度,以及其在各种规则路径中的重要性对源实体的关系路径进行综合分析,充分利用知识图谱的上下文信息和周围邻居节点信息,提升了推理结果的准确率。
-
-
-
-
-
-
-
-
-