-
公开(公告)号:CN116595131B
公开(公告)日:2024-12-06
申请号:CN202310295002.7
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G16H80/00 , G06F18/214
Abstract: 本发明提供一种使用大型语言模型进行医疗问答的方法及系统,该方法包括:获取用户的医疗对话历史内容;将所述医疗对话历史内容和第一提示指令输入大型语言模型,基于所述大型语言模型的多样化采样解码得到多个第一响应;将所述医疗对话历史内容和多个第二提示指令输入所述大型语言模型,得到分别对应于每个所述第二提示指令的多个第二响应;将所述医疗对话历史内容、所述多个第一响应和所述多个第二响应输入所述大型语言模型,生成医疗对话的回复内容并发送给所述用户。使得大型语言模型能够利用整体性思维,提高思维的深度和广度,从而能够生成更准确的回复内容,提升用户的使用体验。
-
公开(公告)号:CN118940814A
公开(公告)日:2024-11-12
申请号:CN202410848998.4
申请日:2024-06-27
Applicant: 中国科学院自动化研究所
IPC: G06N3/08 , G06N5/04 , G06F16/332
Abstract: 本申请提供一种用于控制大型语言模型的人格特点的方法及装置,涉及生成式人工智能推理技术领域。所述方法包括:提取大型语言模型的人格特征差异向量;基于所述人格特征差异向量,调整所述大型语言模型的激活值,得到目标激活值;基于所述目标激活值,控制所述大型语言模型的人格特点,以使所述大型语言模型的输出符合预设需求。本申请提供的用于控制大型语言模型的人格特点的方法及装置,可以精确控制大型语言模型人格特点,改善任务完成效果。
-
公开(公告)号:CN116521834B
公开(公告)日:2025-03-25
申请号:CN202310303093.4
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06F16/3329 , G06F16/334
Abstract: 本申请提供一种文本答案的推理方法、装置及存储介质,所述方法包括:输入第一文本到语言模型,获取所述语言模型输出的多个候选答案;所述第一文本为待识别的文本;以每一候选答案作为条件确定每一候选答案对应的验证分数;所述验证分数表示候选答案的置信度;输出最高验证分数对应的候选答案作为所述第一文本的推理答案。本申请提供的文本答案的推理方法、装置及存储介质,将语言模型生成的答案替换原始条件后,再次输入到语言模型中,从而验证答案。通过这种自我验证的方法,提高了语言模型输出结果的鲁棒性和准确性。
-
公开(公告)号:CN118982003A
公开(公告)日:2024-11-19
申请号:CN202410994182.2
申请日:2024-07-23
Applicant: 中国科学院自动化研究所
Abstract: 提供一种文本数据处理方法和文本数据处理装置。所述文本数据处理方法包括:获取文本数据,并将文本数据输入到通过将语言模型与编译型神经网络融合而生成的文本数据处理模型,其中,语言模型被预先训练,并且编译型神经网络在没有被预先训练的情况下根据要执行的规则密集型任务被分配相应的神经网络权重;基于文本数据处理模型中的语言模型从文本数据确定与文本数据对应的文本数据处理任务;以及响应于文本数据处理任务指示规则密集型任务,基于文本数据处理模型中的编译型神经网络执行规则密集型任务。
-
公开(公告)号:CN116595131A
公开(公告)日:2023-08-15
申请号:CN202310295002.7
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G16H80/00 , G06F18/214
Abstract: 本发明提供一种使用大型语言模型进行医疗问答的方法及系统,该方法包括:获取用户的医疗对话历史内容;将所述医疗对话历史内容和第一提示指令输入大型语言模型,基于所述大型语言模型的多样化采样解码得到多个第一响应;将所述医疗对话历史内容和多个第二提示指令输入所述大型语言模型,得到分别对应于每个所述第二提示指令的多个第二响应;将所述医疗对话历史内容、所述多个第一响应和所述多个第二响应输入所述大型语言模型,生成医疗对话的回复内容并发送给所述用户。使得大型语言模型能够利用整体性思维,提高思维的深度和广度,从而能够生成更准确的回复内容,提升用户的使用体验。
-
公开(公告)号:CN116521834A
公开(公告)日:2023-08-01
申请号:CN202310303093.4
申请日:2023-03-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33
Abstract: 本申请提供一种文本答案的推理方法、装置及存储介质,所述方法包括:输入第一文本到语言模型,获取所述语言模型输出的多个候选答案;所述第一文本为待识别的文本;以每一候选答案作为条件确定每一候选答案对应的验证分数;所述验证分数表示候选答案的置信度;输出最高验证分数对应的候选答案作为所述第一文本的推理答案。本申请提供的文本答案的推理方法、装置及存储介质,将语言模型生成的答案替换原始条件后,再次输入到语言模型中,从而验证答案。通过这种自我验证的方法,提高了语言模型输出结果的鲁棒性和准确性。
-
公开(公告)号:CN116431777A
公开(公告)日:2023-07-14
申请号:CN202310203670.2
申请日:2023-03-06
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本发明提供一种示意图问答方法及系统,该方法包括:获取目标示意图问题,所述目标示意图问题包括目标示意图和所述目标示意图对应的目标问题;将所述目标示意图问题输入到示意图问答模型中,得到所述目标示意图问题对应的预测答案;其中,所述示意图问答模型是由样本示意图问答对和示意图问答对增强数据训练得到的;所述示意图问答对增强数据是通过所述样本示意图问答对构建得到的,包括图像描述增强数据、问题生成增强数据、答案判别增强数据和图文匹配增强数据。本发明基于原始示意图问答对,构建从不同角度理解原始示意图问答对的示意图问答对增强数据,提高了增强数据的准确性,同时提升了示意图问答模型的问答预测性能。
-
-
-
-
-
-