-
公开(公告)号:CN119692351A
公开(公告)日:2025-03-25
申请号:CN202510209039.2
申请日:2025-02-25
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/30 , G06N5/022
Abstract: 本发明提供一种文本生成模型评估方法和装置,应用于自然语言处理技术领域。该方法包括:获取测试数据,所述测试数据包括实体属性和实体类别;根据所述测试数据生成多个测试任务,一个测试任务对应多个测试问题;将所述多个测试任务的测试问题分别输入文本生成模型,得到对应的测试结果,并根据所述测试结果确定所述文本生成模型对本体知识的掌握程度;其中,所述多个测试任务包括实体类别‑层级记忆测试、实体类别‑层级应用测试、实体属性记忆测试以及实体属性应用测试。
-
公开(公告)号:CN119204091A
公开(公告)日:2024-12-27
申请号:CN202411294781.X
申请日:2024-09-14
Applicant: 中国科学院自动化研究所
IPC: G06N3/042 , G06F18/22 , G06N3/045 , G06N3/084 , G06N3/0985 , G06N3/0442
Abstract: 本发明提供一种基于模式匹配的大型语言模型知识编辑方法及装置,其中,上述方法包括:获取目标编辑知识,其中,所述目标编辑知识用于对大型语言模型进行知识更新;确定所述大型语言模型中各个层级与所述目标编辑知识之间的多个模式匹配程度;确定所述多个模式匹配程度中的最高模式匹配程度,将所述最高模式匹配程度所对应的层级作为目标编辑层;基于所述目标编辑知识对所述目标编辑层的多层感知机进行秩一编辑,得到编辑后的大型语言模型;通过本发明能够在准确进行知识编辑的同时不影响其他无关数据。
-
公开(公告)号:CN115618011B
公开(公告)日:2024-12-06
申请号:CN202211193891.8
申请日:2022-09-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06F16/332 , G06N5/02 , G06N3/042 , G06N3/048
Abstract: 本发明提供一种知识问答方法、装置、电子设备和可读存储介质,涉及计算机技术领域,该方法包括:基于获取到的逻辑查询语句构建计算图,并获取计算图中每一个节点的预测节点表示;计算图包括多个节点的节点信息以及相邻节点之间的关联关系,节点信息包括节点深度;针对计算图中的每一个节点,基于节点的前驱节点和后继节点的节点表示对节点的预测节点表示进行校准,得到节点的校准节点表示;基于计算图中节点的校准节点表示以及预设知识图谱中每一个实体的实体表示确定目标实体,并将目标实体作为逻辑查询语句的答案输出,解决了现有技术中如何更好地从知识图谱中检测出逻辑查询语句的答案的技术问题。
-
公开(公告)号:CN118734858A
公开(公告)日:2024-10-01
申请号:CN202410669925.9
申请日:2024-05-28
Applicant: 中国科学院自动化研究所 , 上海人工智能创新中心
Abstract: 本申请提供了一种大模型归纳能力增强方法和装置,涉及自然语言处理技术领域,其中包括:基于待增强大模型对观测样本进行归纳采样,生成多个候选假设;基于所述待增强大模型对上下文进行学习,生成各个候选假设对应的演绎实例;基于各个候选假设对应的演绎实例对所述待增强大模型进行低秩自适应训练,调整所述待增强大模型的模型参数,得到增强大模型;基于所述增强大模型对测试样本进行归纳;所述测试样本与所述观测样本对应相同假设。本申请提供的方法和装置,能够显著地增强大模型的归纳能力。
-
公开(公告)号:CN118606835A
公开(公告)日:2024-09-06
申请号:CN202410656752.7
申请日:2024-05-24
Applicant: 中国科学院自动化研究所 , 上海人工智能创新中心
IPC: G06F18/2431 , G06F18/214 , G06N20/00
Abstract: 本申请提供一种持续小样本事件检测方法及装置,涉及自然语言处理技术领域。所述方法包括:基于历史任务的第一记忆集中的代表样本的事件对进行记忆增强,得到第一事件对;基于当前任务的第二记忆集中事件对的类别进行对比增强,得到第二事件对;基于所述第一事件对与所述第二事件对,确定目标模型;通过所述目标模型对当前任务的持续小样本事件进行检测。本申请提供的持续小样本事件检测方法及装置,可以提升持续小样本事件检测任务的性能。
-
公开(公告)号:CN116992004A
公开(公告)日:2023-11-03
申请号:CN202311069119.X
申请日:2023-08-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06N3/08
Abstract: 本发明提供一种基于统一查询编码器的知识图谱复杂问答方法及装置,其中方法包括:获取查询图的全局特征表示;全局特征表示用于反映查询图的头实体和头实体之间的关系类型的特征信息;将全局特征表示和实体表示输入至神经链接预测器中,由神经链接预测器得到并输出预测尾实体;神经链接预测器是基于知识图谱补全任务训练得到的;实体表示是基于神经链接预测器预先确定的。本发明提供的方法及装置,通过端到端的方法将复杂查询编码为与简单查询相同的形式,从而能够充分利用神经链接预测器,该查询过程可以视为端到端地从神经链接预测器中直接检索答案,因此能够避免逐步计算所有中间节点所产生的错误累积,提高知识问答的成功率以及准确度。
-
公开(公告)号:CN116595131A
公开(公告)日:2023-08-15
申请号:CN202310295002.7
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G16H80/00 , G06F18/214
Abstract: 本发明提供一种使用大型语言模型进行医疗问答的方法及系统,该方法包括:获取用户的医疗对话历史内容;将所述医疗对话历史内容和第一提示指令输入大型语言模型,基于所述大型语言模型的多样化采样解码得到多个第一响应;将所述医疗对话历史内容和多个第二提示指令输入所述大型语言模型,得到分别对应于每个所述第二提示指令的多个第二响应;将所述医疗对话历史内容、所述多个第一响应和所述多个第二响应输入所述大型语言模型,生成医疗对话的回复内容并发送给所述用户。使得大型语言模型能够利用整体性思维,提高思维的深度和广度,从而能够生成更准确的回复内容,提升用户的使用体验。
-
公开(公告)号:CN116521834A
公开(公告)日:2023-08-01
申请号:CN202310303093.4
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33
Abstract: 本申请提供一种文本答案的推理方法、装置及存储介质,所述方法包括:输入第一文本到语言模型,获取所述语言模型输出的多个候选答案;所述第一文本为待识别的文本;以每一候选答案作为条件确定每一候选答案对应的验证分数;所述验证分数表示候选答案的置信度;输出最高验证分数对应的候选答案作为所述第一文本的推理答案。本申请提供的文本答案的推理方法、装置及存储介质,将语言模型生成的答案替换原始条件后,再次输入到语言模型中,从而验证答案。通过这种自我验证的方法,提高了语言模型输出结果的鲁棒性和准确性。
-
公开(公告)号:CN116431777A
公开(公告)日:2023-07-14
申请号:CN202310203670.2
申请日:2023-03-06
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本发明提供一种示意图问答方法及系统,该方法包括:获取目标示意图问题,所述目标示意图问题包括目标示意图和所述目标示意图对应的目标问题;将所述目标示意图问题输入到示意图问答模型中,得到所述目标示意图问题对应的预测答案;其中,所述示意图问答模型是由样本示意图问答对和示意图问答对增强数据训练得到的;所述示意图问答对增强数据是通过所述样本示意图问答对构建得到的,包括图像描述增强数据、问题生成增强数据、答案判别增强数据和图文匹配增强数据。本发明基于原始示意图问答对,构建从不同角度理解原始示意图问答对的示意图问答对增强数据,提高了增强数据的准确性,同时提升了示意图问答模型的问答预测性能。
-
公开(公告)号:CN111061850B
公开(公告)日:2023-04-28
申请号:CN201911276031.9
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F18/232 , G06F18/2411 , G06F18/214
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于信息增强的对话状态跟踪方法、系统、装置,旨在解决现有对话状态跟踪方法仅利用对话文本的上下文信息生成的未知槽值的准确度较差的问题。本系统方法包括基于用户t时刻的对话文本,通过对话状态跟踪模型得到t时刻的对话状态;t时刻的对话状态包括一或多个槽值对及对应的概率;所述槽值对包括槽、槽值;所述对话状态跟踪模型基于编码器‑解码器架构的神经网络构建。本发明提高了未知槽值生成的准确度。
-
-
-
-
-
-
-
-
-