-
公开(公告)号:CN119443059A
公开(公告)日:2025-02-14
申请号:CN202411537890.X
申请日:2024-10-31
Applicant: 苏州大学
IPC: G06F40/166 , G06N3/045 , G06N3/0985 , G06N5/022
Abstract: 本发明提供一种基于注意力漂移约束的稳定知识编辑方法及系统,涉及自然语言处理技术领域,该方法包括大型语言模型的知识编辑过程中,引入选择性注意力漂移限制策略;通过比较编辑前后的模型注意力输出,定位出现严重注意力漂移现象的注意力头;基于新的优化目标目标函数,对模型进行训练,得到最优的模型参数,实现稳定知识编辑。本发明显著提升编辑准确性并降低错误答案概率,实验验证表明该方法有效改进了特异性任务性能,为大型语言模型的知识编辑提供了理论支持和实践指导。