Saved successfully
Save failed
Saved Successfully
Save Failed
公开(公告)号:CN119397536A
公开(公告)日:2025-02-07
申请号:CN202411185875.3
申请日:2024-08-27
Applicant: 北京大学
Inventor: 张世琨 , 谢睿 , 叶蔚 , 于倬浩
IPC: G06F21/57 , G06N5/04
Abstract: 本发明提供一种大型语言模型评估方法及装置。涉及数据处理技术领域,包括:获取完成训练的目标大语言模型;基于目标攻击算法对所述目标大语言模型进行攻击评估,得到攻击评估特征;基于目标统计算法或者目标评估模型,对所述攻击评估特征进行评估,得到所述目标大语言模型的风险评估等级。