-
公开(公告)号:CN119940547A
公开(公告)日:2025-05-06
申请号:CN202510038995.9
申请日:2025-01-10
Applicant: 扬州大学
IPC: G06N5/04 , G06N3/042 , G06N3/084 , G06F40/126 , G06F40/30 , G06F16/953
Abstract: 本发明公开了一种基于大语言模型负面推理的假新闻检测方法,包括1)推理生成:选取带有真实标签的新闻作为监督数据;设计提示模板,根据新闻内容及其真实标签生成对应的正面推理和负面推理;2)利用包含标签信息的自增强推理修正方法,检查推理的极性是否与预设一致,并评估其对评分的影响是否符合置信度变化的限制;3)构建教师模型,使用预训练模型对新闻及其正面推理和负面推理进行编码;4)将教师模型中对推理学习到的语义知识传递到学生模型中,学生模型通过蒸馏过程继承教师模型的核心参数与知识,并直接对新闻内容进行预测。本发明利用了大语言模型在知识幻觉状态下生成的负面推理,能够更有效地识别和检测假新闻。
-
公开(公告)号:CN119848253A
公开(公告)日:2025-04-18
申请号:CN202411925450.1
申请日:2024-12-25
Applicant: 扬州大学
IPC: G06F16/35 , G06F18/241 , G06F18/214 , G06F18/25
Abstract: 本发明公开了一种基于软提示调优模型防御中文文本对抗性攻击方法,包括1)使用五种特定于中文的文本攻击策略生成目标域数据,并引入源域和目标域来模拟原始文本和对抗文本;2)基于少量源域数据去训练初始的软提示调优模型,为目标域实例分配伪标签;3)将目标域实例划分为n个子集,通过多次迭代获取目标域实例的n个标签,同时结合图注意力模型分析句法特征;4)通过投票机制选出在多次迭代中一致的标签,作为最终训练数据进行模型训练,实现中文对抗文本的分类预测。本发明通过少量源域数据训练初始模型,揭示目标域的真实标签信息,并通过投票机制结合图注意力增强中文语法特征的软提示调优模型,实现准确分类。
-