-
公开(公告)号:CN119558280A
公开(公告)日:2025-03-04
申请号:CN202411677572.3
申请日:2024-11-22
Applicant: 中国科学院自动化研究所
IPC: G06F40/16 , G06F40/253 , G06F40/268 , G06F40/166 , G06N3/0475 , G06N3/0455 , G06N3/09 , G06N3/047
Abstract: 本发明公开了一种基于词性评判的大语言模型事实增强解码方法。该方法包括以下主要步骤:对大型语言模型各层中的文本进行幻觉部分的词性分布分析,确定干预目标词性;基于干预目标词性,确定事实词汇与幻觉词汇在同一个句子中的输出概率趋势;构建针对不同干预目标词性的评判器,并基于事实词汇与幻觉词汇在同一个句子中的输出概率趋势对评判器进行训练;在大型语言模型生成文本的解码过程中,利用训练好的评判器实时监测模型输出,检测潜在的幻觉信号,根据检测到的幻觉信号,动态调整大型语言模型的事实文本生成过程中的选项。本发明与传统方法相比能够显著提高生成内容的事实准确性,且无需借助外部资源或模型。