一种主动挖掘和评估越狱漏洞的自动模糊检测方法及系统

    公开(公告)号:CN118395442A

    公开(公告)日:2024-07-26

    申请号:CN202410274048.5

    申请日:2024-03-11

    Applicant: 武汉大学

    Abstract: 本发明公开了一种主动挖掘和评估越狱漏洞的自动模糊检测方法及系统,通过将越狱提示拆分成模糊模板、约束条件和非法问题三个基本组成部分,并为不同基类和组合类的越狱攻击分别设计模糊模板,并生成大量在意思上不同的越狱提示作为挖掘漏洞的测试用例,将其作为输入提供给特定的待测模型,并记录模型的响应作为攻击结果。本发明利用传统安全领域中的模糊测试的思想,设计了一种创新的提示生成策略,利用模糊模板、约束条件和非法问题集生成了丰富的越狱提示,进而组合成强大的组合攻击,扩大了可检测到的潜在越狱漏洞的范围,能有效地在大型语言模型中主动挖掘和评估出潜在的越狱漏洞,使得模型拥有者能提前并主动应对模型攻击者可能的越狱攻击。

    一种双层级交互的领域自适应图像语义分割方法及系统

    公开(公告)号:CN116385718A

    公开(公告)日:2023-07-04

    申请号:CN202310221010.7

    申请日:2023-03-08

    Applicant: 武汉大学

    Abstract: 本发明提供一种双层级交互的领域自适应图像语义分割方法及系统,属于计算机视觉技术领域,包括:构建源域图像集合的初始图像实例库;训练确定初始分割模型;基于语义层级领域自适应,利用初始分割模型生成目标域图像集合的语义伪标签;在源域图像集合中采用类均衡确定像素实例特征和对应真实标签,利用像素实例特征和对应真实标签更新初始图像实例库;生成实例层级伪标签,基于实例层级伪标签,采用反向传递回传优化更新后的初始图像实例库,得到图像语义分割结果。本发明在语义层级基础上引入实例层级的判别,辅助校准语义分类器无法正确分类的噪声伪标签,对图像的语义分割能实现更快的训练速度,具有成本低和分类精度高的特点。

Patent Agency Ranking