-
公开(公告)号:CN119166770A
公开(公告)日:2024-12-20
申请号:CN202411183795.4
申请日:2024-08-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/33 , G06F40/16
Abstract: 本发明提出一种大模型幻觉缓解方法、装置、存储介质,该方法包含:接收给定的图像和提示文本作为输入,通过一大规模视觉语言模型生成多个文本样本;对比该多个文本样本中的不一致性,搜索出矛盾点,确定幻觉因素;生成针对该幻觉因素的问题;根据该问题进行问答,利用一视觉问答模型分析该图像内容,输出针对该问题的答案,且利用该答案修正该提示文本;利用修正后的提示文本,重新生成优化后的文本样本。该方法能够有效缓解大规模视觉语言模型产生的幻觉,提升大模型生成的效果。