-
公开(公告)号:CN119066183B
公开(公告)日:2025-05-13
申请号:CN202411570021.7
申请日:2024-11-06
Applicant: 浙江大学
IPC: G06F16/3329 , G06F16/334 , G06F18/22 , G06N3/0455 , G06N5/022
Abstract: 本发明提供了一种开放域问答方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取待查询问题,在知识库中检索待查询问题的相关文档;将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。该方法能够提高大语言模型对于复杂问题的回答准确性。
-
公开(公告)号:CN119066155A
公开(公告)日:2024-12-03
申请号:CN202411570038.2
申请日:2024-11-06
Applicant: 浙江大学
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F18/214 , G06F18/22 , G06N5/022 , G06F18/23213 , G06N3/0455 , G06N3/084
Abstract: 本发明提供了一种大语言模型的训练方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取大语言模型的原始训练数据集,基于原始训练数据集中的问题在知识库中进行检索,得到问题的多个相关文档和不相关文档;预测问题在多个相关文档中的答案和对应的概率,将预测的概率与预设阈值进行比较,若目标答案对应的预测概率大于或者等于预设阈值,则将目标答案所在的文档作为目标文档;基于目标文档构建问答样本,基于不相关文档构建拒答样本;基于问答样本和拒答样本对大语言模型进行训练。该方法能够降低大语言模型产生幻觉、生成无关内容的风险,提高大语言模型的准确率。
-
公开(公告)号:CN119128118A
公开(公告)日:2024-12-13
申请号:CN202411612390.8
申请日:2024-11-13
Applicant: 浙江大学
IPC: G06F16/332 , G06V30/148
Abstract: 本发明提供了一种视觉问答数据增强方法、装置、设备及存储介质,属于人工智能技术领域,包括获取视觉问答任务的原始数据集;提取原始问题中用于描述原始图像中物体的目标名词,将目标名词输入大语言模型,通过大语言模型生成多个与目标名词相关的新问答对,将新问答对和原始问答对进行合并得到增强后的文本提示;根据数据增强后的文本提示,对原始图像进行目标检测,得到文本提示对应物体的边界框,基于边界框对图像进行分割提取,得到分割掩码图像;根据分割掩码图像及数据增强后的文本提示对原始图像进行重绘,得到增强后的图像。该方法能够得到更高质量的视觉问答数据,从而提高视觉问答模型的准确性,减少VQA中的语言偏差问题。
-
公开(公告)号:CN119066183A
公开(公告)日:2024-12-03
申请号:CN202411570021.7
申请日:2024-11-06
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/33 , G06F18/22 , G06N3/0455 , G06N5/022
Abstract: 本发明提供了一种开放域问答方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取待查询问题,在知识库中检索待查询问题的相关文档;将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。该方法能够提高大语言模型对于复杂问题的回答准确性。
-
-
-